更改

跳到导航 跳到搜索
添加1,481字节 、 2021年6月13日 (日) 22:10
无编辑摘要
第48行: 第48行:  
这些困难的根源在于,在方法上,根据在回归方程中添加第三个变量所引起的变化来定义中介。虽然这种统计上的变化是伴随中介效应而来的附带现象。但这样的做法未能充分捕捉到中介分析的本质,即量化因果关系。
 
这些困难的根源在于,在方法上,根据在回归方程中添加第三个变量所引起的变化来定义中介。虽然这种统计上的变化是伴随中介效应而来的附带现象。但这样的做法未能充分捕捉到中介分析的本质,即量化因果关系。
   −
 
+
因果方法的基本前提是,当我们试图估计自变量 <nowiki><math>X </nowiki><nowiki></math></nowiki>对因变量 <nowiki><math>Y </nowiki><nowiki></math></nowiki>的直接影响时,并不总是适合对中介M进行“控制”(见上图)。对M进行“控制”的经典理论是,如果我们成功地阻止了M的变化,那么我们在Y中测量的任何变化都只能归因于X的变化,然后我们就有理由宣布观察到的效果是“X<nowiki></math></nowiki>对Y<nowiki></math></nowiki>的直接影响”。不幸的是,“控制M”并不能从物理上阻止M的改变;它只是把分析者的注意力集中在相等<nowiki><math> M </nowiki><nowiki></math></nowiki>值的情况下。而且,概率论的语言没有表示“阻止M改变”或“物理上保持M不变”的符号。唯一的运算是“以…为条件”(conditioning),这是当我们“控制” <nowiki><math>M </nowiki><nowiki></math></nowiki>时所做的。或者为 Y<nowiki></math></nowiki> 的方程添加 M <nowiki></math></nowiki>作为其中的一个回归变量。 结果是,与在物理上保持 M <nowiki></math></nowiki>不变(例如 M = m )并将 X = 1<nowiki></math></nowiki> 下 Y<nowiki></math></nowiki> 的单位 与<nowiki><math> X = 0 </nowiki><nowiki></math></nowiki>下<nowiki><math> Y </nowiki><nowiki></math></nowiki>的单位进行比较的方法不同,我们允许 M 变化但忽略所有使得 M=m 的其他单位。这两个操作除了没有遗漏变量的情况,本质上是不同的,产生不同的结果<ref>Robins, J.M.; Greenland, S. (1992). "Identifiability and exchangeability for direct and indirect effects". ''Epidemiology''. '''3''' (2): 143–155. ''doi'':''10.1097/00001648-199203000-00013''. ''PMID'' ''1576220''.</ref><ref>''Jump up to: '''a''''' '''''b''''' Pearl, Judea (1994). Lopez de Mantaras, R.; Poole, D. (eds.). "A probabilistic calculus of actions". ''Uncertainty in Artificial Intelligence 10''. San Mateo, CA: ''Morgan Kaufmann''. '''1302''': 454–462. ''arXiv'':''1302.6835''. ''Bibcode'':''2013arXiv1302.6835P''.</ref>
 
  −
因果方法的基本前提是,当我们试图估计自变量 <nowiki><math>X </nowiki><nowiki></math></nowiki>对 因变量 <nowiki><math>Y </nowiki><nowiki></math></nowiki>的直接影响时,并不总是适合对中介M进行“控制”(见上图)。对M进行“控制”的经典理论是,如果我们成功地阻止了M的变化,那么我们在Y中测量的任何变化都只能归因于X的变化,然后我们就有理由宣布观察到的效果是“X<nowiki></math></nowiki>对Y<nowiki></math></nowiki>的直接影响”。不幸的是,“控制M”并不能从物理上阻止M的改变;它只是把分析者的注意力集中在相等<nowiki><math> M </nowiki><nowiki></math></nowiki>值的情况下。而且,概率论的语言没有表示“阻止M改变”或“物理上保持M不变”的符号。唯一的运算是“以…为条件”(conditioning),这是当我们“控制” <nowiki><math>M </nowiki><nowiki></math></nowiki>时所做的。或者为 Y<nowiki></math></nowiki> 的方程添加 M <nowiki></math></nowiki>作为其中的一个回归变量。 结果是,与在物理上保持 M <nowiki></math></nowiki>不变(例如 M = m )并将 X = 1<nowiki></math></nowiki> 下 Y<nowiki></math></nowiki> 的单位 与<nowiki><math> X = 0 </nowiki><nowiki></math></nowiki>下<nowiki><math> Y </nowiki><nowiki></math></nowiki>的单位进行比较的方法不同,我们允许 M 变化但忽略所有使得 M=m 的其他单位。这两个操作除了没有遗漏变量的情况,本质上是不同的,产生不同的结果[21][22]。
      
举例来说,假设<nowiki><math> M </nowiki><nowiki></math></nowiki>和<nowiki><math> Y</nowiki><nowiki></math></nowiki> 的误差项是相关的。在这种情况下,通过对 <nowiki><math>Y </nowiki><nowiki></math></nowiki>在 <nowiki><math>X</nowiki><nowiki></math></nowiki> 和 <nowiki><math>M </nowiki><nowiki></math></nowiki>上进行回归,就无法对结构系数<nowiki><math> B </nowiki><nowiki></math></nowiki>和 <nowiki><math>A</nowiki><nowiki></math></nowiki>(在<nowiki><math>M</nowiki><nowiki></math></nowiki>和<nowiki><math>Y</nowiki><nowiki></math></nowiki>之间,在<nowiki><math>Y</nowiki><nowiki></math></nowiki>和<nowiki><math>X</nowiki><nowiki></math></nowiki>之间) 进行估计。事实上,即使当 <nowiki><math>C</nowiki><nowiki></math></nowiki> 等于 0 的时候,回归斜率也可能不等于 0 。这有两种后果。首先必须设计新的策略来估计结构系数 <nowiki><math>A</nowiki><nowiki></math></nowiki>、<nowiki><math>B</nowiki><nowiki></math></nowiki> 和 <nowiki><math>C</nowiki><nowiki></math></nowiki>。其次,直接和间接效应的基本定义必须超越回归分析,并且应该采用类似于“固定 <nowiki><math>M</nowiki><nowiki></math></nowiki>”的操作,而不是“在<nowiki><math> M </nowiki><nowiki></math></nowiki>的条件下”的操作。
 
举例来说,假设<nowiki><math> M </nowiki><nowiki></math></nowiki>和<nowiki><math> Y</nowiki><nowiki></math></nowiki> 的误差项是相关的。在这种情况下,通过对 <nowiki><math>Y </nowiki><nowiki></math></nowiki>在 <nowiki><math>X</nowiki><nowiki></math></nowiki> 和 <nowiki><math>M </nowiki><nowiki></math></nowiki>上进行回归,就无法对结构系数<nowiki><math> B </nowiki><nowiki></math></nowiki>和 <nowiki><math>A</nowiki><nowiki></math></nowiki>(在<nowiki><math>M</nowiki><nowiki></math></nowiki>和<nowiki><math>Y</nowiki><nowiki></math></nowiki>之间,在<nowiki><math>Y</nowiki><nowiki></math></nowiki>和<nowiki><math>X</nowiki><nowiki></math></nowiki>之间) 进行估计。事实上,即使当 <nowiki><math>C</nowiki><nowiki></math></nowiki> 等于 0 的时候,回归斜率也可能不等于 0 。这有两种后果。首先必须设计新的策略来估计结构系数 <nowiki><math>A</nowiki><nowiki></math></nowiki>、<nowiki><math>B</nowiki><nowiki></math></nowiki> 和 <nowiki><math>C</nowiki><nowiki></math></nowiki>。其次,直接和间接效应的基本定义必须超越回归分析,并且应该采用类似于“固定 <nowiki><math>M</nowiki><nowiki></math></nowiki>”的操作,而不是“在<nowiki><math> M </nowiki><nowiki></math></nowiki>的条件下”的操作。
第61行: 第59行:  
同时,应用了<math>do(X = x)<math> 运算的模型会变为:
 
同时,应用了<math>do(X = x)<math> 运算的模型会变为:
 
<math>{\displaystyle X=x,M=g(x,\varepsilon _{2}),Y=h(x,M,\varepsilon _{3})}</math>
 
<math>{\displaystyle X=x,M=g(x,\varepsilon _{2}),Y=h(x,M,\varepsilon _{3})}</math>
其中函数 f 和 g 以及误差项 ε1 <nowiki></math></nowiki>和 ε3 <nowiki></math></nowiki>的分布保持不变。如果我们进一步将 <math>do(X = x)</math>得到的变量 <math>M</math> 和 <math>Y</math> 分别重新命名为 <math>M(x)</math>和 <math>Y(x)</math> ,我们得到了所谓的“潜在结果(potential outcome)”[24]或“结构反事实(structural counterfactuals)”[25]这些新变量为定义直接和间接效应提供了便利的描述符号。具体来说,定义了从 <math>X = 0</math> 到 <math>X = 1</math>变化的四种效应:
+
其中函数 f 和 g 以及误差项 ε1 <nowiki></math></nowiki>和 ε3 <nowiki></math></nowiki>的分布保持不变。如果我们进一步将 <math>do(X = x)</math>得到的变量 <math>M</math> 和 <math>Y</math> 分别重新命名为 <math>M(x)</math>和 <math>Y(x)</math> ,我们得到了所谓的“潜在结果(potential outcome)”[24]或“结构反事实(structural counterfactuals)”<ref>Rubin, D.B. (1974). ''"Estimating causal effects of treatments in randomized and nonrandomized studies"''. ''Journal of Educational Psychology''. '''66''' (5): 688–701. ''doi'':''10.1037/h0037350''.</ref>
 +
 
 +
 
 +
 
 +
这些新变量为定义直接和间接效应提供了便利的描述符号。具体来说,定义了从 <math>X = 0</math> 到 <math>X = 1</math>变化的四种效应:
    
'''(a) 总体效应 –'''
 
'''(a) 总体效应 –'''
第88行: 第90行:  
因此,当模型被识别时,所有的效应都是可估计的。在非线性系统中,估计直接和间接效应需要更严格的条件,如不存在混杂因子(即 <math>ε_1、ε_2、ε_3</math> 相互独立),可推导出如下公式
 
因此,当模型被识别时,所有的效应都是可估计的。在非线性系统中,估计直接和间接效应需要更严格的条件,如不存在混杂因子(即 <math>ε_1、ε_2、ε_3</math> 相互独立),可推导出如下公式
 
<math>{\displaystyle {\begin{aligned}TE&=E(Y\mid X=1)-E(Y\mid X=0)\\CDE(m)&=E(Y\mid X=1,M=m)-E(Y\mid X=0,M=m)\\NDE&=\sum _{m}[E(Y|X=1,M=m)-E(Y\mid X=0,M=m)]P(M=m\mid X=0)\\NIE&=\sum _{m}[P(M=m\mid X=1)-P(M=m\mid X=0)]E(Y\mid X=0,M=m).\end{aligned}}}</math>
 
<math>{\displaystyle {\begin{aligned}TE&=E(Y\mid X=1)-E(Y\mid X=0)\\CDE(m)&=E(Y\mid X=1,M=m)-E(Y\mid X=0,M=m)\\NDE&=\sum _{m}[E(Y|X=1,M=m)-E(Y\mid X=0,M=m)]P(M=m\mid X=0)\\NIE&=\sum _{m}[P(M=m\mid X=1)-P(M=m\mid X=0)]E(Y\mid X=0,M=m).\end{aligned}}}</math>
后两个方程被称为中介公式[28][29][30],已成为许多中介研究的估计对象。他们给出了直接和间接效应的无分布假设(distribution-free)表达式,并证明,尽管误差分布和函数 f, g, h 的性质难以确定,中介效应仍然可以通过使用回归方法利用数据来估计。调节中介和中介调节的分析属于因果中介分析的特例。中介公式确定了各种相互作用系数如何贡献于中介的必要和充分成分。
+
后两个方程被称为中介公式<ref>''Jump up to: '''a''''' '''''b''''' Pearl, Judea (2009). ''"Causal inference in statistics: An overview"'' (PDF). ''Statistics Surveys''. '''3''': 96–146. ''doi'':''10.1214/09-ss057''.</ref><ref>''Jump up to: '''a''''' '''''b''''' Vansteelandt, Stijn; Bekaert, Maarten; Lange, Theis (2012). "Imputation strategies for the estimation of natural direct and indirect effects". ''Epidemiologic Methods''. '''1''' (1, Article 7). ''doi'':''10.1515/2161-962X.1014''.</ref><ref>''Jump up to: '''a''''' '''''b''''' Albert, Jeffrey (2012). ''"Distribution-Free Mediation Analysis for Nonlinear Models with Confounding"''. ''Epidemiology''. '''23''' (6): 879–888. ''doi'':''10.1097/ede.0b013e31826c2bb9''. ''PMC'' ''3773310''. ''PMID'' ''23007042''.</ref>
 +
 
 +
 
 +
已成为许多中介研究的估计对象。他们给出了直接和间接效应的无分布假设(distribution-free)表达式,并证明,尽管误差分布和函数 f, g, h 的性质难以确定,中介效应仍然可以通过使用回归方法利用数据来估计。调节中介和中介调节的分析属于因果中介分析的特例。中介公式确定了各种相互作用系数如何贡献于中介的必要和充分成分。
    
===简单案例===  
 
===简单案例===  

导航菜单