与深度学习一样,这门学科的一些关键概念如果缺乏清晰理解,就很容易迷失。
Causal structure的学习问题:从一组样本中发现Causal structure,面临两重天:首先,要根据样本获得分布,然后,根据分布发现causal link。 In both, we need some assumption without which it is impossible。
这里,首先是根据样本去学习一个分布,以前谈过,这是一个ill posed problem。另外,即使得到了这个分布,要单单从分布中获得因果关系,没有一般性方法,所以这又是一个ill posed problem。这是其一。其二,注意,是没有一般性方法,但有特殊方法。如果对SCM中的f做约束,或者对噪声做约束,则有方法完全根据分布获得因果结构。这一点一定要理解。这里面一个重要的概念是概率的条件独立性,这里没必要深入谈。完全从静态的observational distribution获得因果结构,叫做causal identification。一旦谈到causal identification,一定是对这个observational distribution做了假定和约束。假定,约束,先验,都是一个意思。手头只有样本,第一步用假定,约束,先验来学习变量联合分布,第二部,同样要有假定,约束,先验来从这个分布中学习因果结构。
以上概念极端重要。
另外的方法就是intervention。这时已经不再单单依赖观察数据,而是一种主动的行动。由于干预,分布发生变化,通过干预来获得因果结构,就是在分布的动态变化中获得因果结构。这个方向是因果推理的重头戏。