更改

第194行: 第194行:  
最后,我们统一探讨独立成分分析(ICA)和因果学习之间的关系。简单来说,因果发现是ICA问题的一种特殊情况。ICA解决的问题是从(线性或非线性)混杂的信号中识别出相互独立的成分。而函数功能因果模型(FCM)的数据生成过程正是将相互独立的噪声,通过因果关系混杂成观测到数据。两者唯一的区别是,FCM在结构上需满足有向非环图(DAG),或在时序数据上满足Granger Causality假设等。线性ICA的可识别性只需满足non-Gaussian source就可达到,因此LiNGAM能将ICA直接应用到线性条件下的因果发现问题。然而,nonlinear ICA的可识别性是非常困难的问题。直到近两年,人们才发现在能找到多个domain的数据,并且因果隐变量在额外提供的surrogate variable下被条件独立时,我们才能恢复出这些因果隐变量。在[Ricardo Pio et al. 2022] 中,我们就是使用这种nonlinear ICA的可识别性,实现非线性的因果发现的。
 
最后,我们统一探讨独立成分分析(ICA)和因果学习之间的关系。简单来说,因果发现是ICA问题的一种特殊情况。ICA解决的问题是从(线性或非线性)混杂的信号中识别出相互独立的成分。而函数功能因果模型(FCM)的数据生成过程正是将相互独立的噪声,通过因果关系混杂成观测到数据。两者唯一的区别是,FCM在结构上需满足有向非环图(DAG),或在时序数据上满足Granger Causality假设等。线性ICA的可识别性只需满足non-Gaussian source就可达到,因此LiNGAM能将ICA直接应用到线性条件下的因果发现问题。然而,nonlinear ICA的可识别性是非常困难的问题。直到近两年,人们才发现在能找到多个domain的数据,并且因果隐变量在额外提供的surrogate variable下被条件独立时,我们才能恢复出这些因果隐变量。在[Ricardo Pio et al. 2022] 中,我们就是使用这种nonlinear ICA的可识别性,实现非线性的因果发现的。
   −
[[File:nonlinear ICA.png|800px|center|thumb]]
+
[[File:nonlinear ICA.png|800px|left|thumb]]
    
因果表征学习则更是与ICA息息相关。例如,之前我们讨论的时序因果表征学习[Yao et al., 2021 & 2022]和迁移学习[Kong et. al., 2022],都可视为这类情况下的nonlinear ICA在因果表征学习领域的拓展。然而,这类ICA方法的限制在于,训练数据必须含有足以解释domain区别的surrogate variable,而且这些surrogate variable可使因果隐变量独立。自然,我们会有疑问:在没有surrogate variable的情况下,nonlinear ICA是否也能达到的可识别性呢?在[Zheng et. al., 2022]中,我们使用structural sparsity assumption来回答这个问题。我们发现如果在生成过程中,对每个隐变量Si,我们都能找到一组变量{Xi},使得Si是这组变量唯一的共有parent时,nonlinear ICA就可以达到可识别性。例如,在左图中,对于X1和X4,S1是它们之间唯一共有的parent。在这种结构稀疏性的条件下,我们可以在没有surrogate variable的情况下实现nonlinear ICA的可识别性。这类sparse nonlinear ICA在因果表征学习上的拓展会是一个很有意思的研究方向。
 
因果表征学习则更是与ICA息息相关。例如,之前我们讨论的时序因果表征学习[Yao et al., 2021 & 2022]和迁移学习[Kong et. al., 2022],都可视为这类情况下的nonlinear ICA在因果表征学习领域的拓展。然而,这类ICA方法的限制在于,训练数据必须含有足以解释domain区别的surrogate variable,而且这些surrogate variable可使因果隐变量独立。自然,我们会有疑问:在没有surrogate variable的情况下,nonlinear ICA是否也能达到的可识别性呢?在[Zheng et. al., 2022]中,我们使用structural sparsity assumption来回答这个问题。我们发现如果在生成过程中,对每个隐变量Si,我们都能找到一组变量{Xi},使得Si是这组变量唯一的共有parent时,nonlinear ICA就可以达到可识别性。例如,在左图中,对于X1和X4,S1是它们之间唯一共有的parent。在这种结构稀疏性的条件下,我们可以在没有surrogate variable的情况下实现nonlinear ICA的可识别性。这类sparse nonlinear ICA在因果表征学习上的拓展会是一个很有意思的研究方向。
7,129

个编辑