更改

跳到导航 跳到搜索
添加626字节 、 2021年6月13日 (日) 22:22
第39行: 第39行:       −
我们采用Sobel’s test<ref>''Jump up to: '''a''''' '''''b''''' Sobel, M. E. (1982). "Asymptotic confidence intervals for indirect effects in structural equation models". ''Sociological Methodology''. '''13''': 290–312. ''doi'':''10.2307/270723''. ''JSTOR'' ''270723''.</ref>来检验中介变量加入后自变量与因变量之间的关系是否显著降低,从而评估中介效应是否显著。然而,这种方式的统计效力(Power)很低。因此,为了有足够的效力检测显著性影响,需要大的样本量。这是因为Sobel检验的关键假设是正态性假设。因为Sobel检验是根据正态分布来评估给定样本的,所以样本规模小和抽样分布的偏态可能会有问题(详见正态分布)。因此,MacKinnon et al .,(2002)<ref>MacKinnon, D. P.; Lockwood, C. M.; Lockwood, J. M.; West, S. G.; Sheets, V. (2002). ''"A comparison of methods to test mediation and other intervening variable effects"''. ''Psychological Methods''. '''7''' (1): 83–104. ''doi'':''10.1037/1082-989x.7.1.83''. ''PMC'' ''2819363''. ''PMID'' ''11928892''.</ref>所建议的经验法是,检测较小的效应需要1000个样本,检测中等效应需要100个样本,检测较大效应需要50个样本。基于自助法的检验能减少对样本量的依赖,见 Preacher and Hayes(2004)。
+
我们采用Sobel’s test<ref>''Jump up to: '''a''''' '''''b''''' Sobel, M. E. (1982). "Asymptotic confidence intervals for indirect effects in structural equation models". ''Sociological Methodology''. '''13''': 290–312. ''doi'':''10.2307/270723''. ''JSTOR'' ''270723''.</ref>来检验中介变量加入后自变量与因变量之间的关系是否显著降低,从而评估中介效应是否显著。然而,这种方式的统计效力(Power)很低。因此,为了有足够的效力检测显著性影响,需要大的样本量。这是因为Sobel检验的关键假设是正态性假设。因为Sobel检验是根据正态分布来评估给定样本的,所以样本规模小和抽样分布的偏态可能会有问题(详见正态分布)。因此,MacKinnon et al .,(2002)<ref>MacKinnon, D. P.; Lockwood, C. M.; Lockwood, J. M.; West, S. G.; Sheets, V. (2002). ''"A comparison of methods to test mediation and other intervening variable effects"''. ''Psychological Methods''. '''7''' (1): 83–104. ''doi'':''10.1037/1082-989x.7.1.83''. ''PMC'' ''2819363''. ''PMID'' ''11928892''.</ref>所建议的经验法是,检测较小的效应需要1000个样本,检测中等效应需要100个样本,检测较大效应需要50个样本。基于自助法的检验能减少对样本量的依赖,见 Preacher and Hayes(2004)<ref>Preacher, K.J., Hayes, A.F. SPSS and SAS procedures for estimating indirect effects in simple mediation models. ''Behavior Research Methods, Instruments, & Computers'' 36, 717–731 (2004). <nowiki>https://doi.org/10.3758/BF03206553</nowiki></ref>
    
==因果中介分析==
 
==因果中介分析==
第48行: 第48行:  
这些困难的根源在于,在方法上,根据在回归方程中添加第三个变量所引起的变化来定义中介。虽然这种统计上的变化是伴随中介效应而来的附带现象。但这样的做法未能充分捕捉到中介分析的本质,即量化因果关系。
 
这些困难的根源在于,在方法上,根据在回归方程中添加第三个变量所引起的变化来定义中介。虽然这种统计上的变化是伴随中介效应而来的附带现象。但这样的做法未能充分捕捉到中介分析的本质,即量化因果关系。
   −
因果方法的基本前提是,当我们试图估计自变量 <nowiki><math>X </nowiki><nowiki></math></nowiki>对因变量 <nowiki><math>Y </nowiki><nowiki></math></nowiki>的直接影响时,并不总是适合对中介M进行“控制”(见上图)。对M进行“控制”的经典理论是,如果我们成功地阻止了M的变化,那么我们在Y中测量的任何变化都只能归因于X的变化,然后我们就有理由宣布观察到的效果是“X<nowiki></math></nowiki>对Y<nowiki></math></nowiki>的直接影响”。不幸的是,“控制M”并不能从物理上阻止M的改变;它只是把分析者的注意力集中在相等<nowiki><math> M </nowiki><nowiki></math></nowiki>值的情况下。而且,概率论的语言没有表示“阻止M改变”或“物理上保持M不变”的符号。唯一的运算是“以…为条件”(conditioning),这是当我们“控制” <nowiki><math>M </nowiki><nowiki></math></nowiki>时所做的。或者为 Y<nowiki></math></nowiki> 的方程添加 M <nowiki></math></nowiki>作为其中的一个回归变量。 结果是,与在物理上保持 M <nowiki></math></nowiki>不变(例如 M = m )并将 X = 1<nowiki></math></nowiki> 下 Y<nowiki></math></nowiki> 的单位 与<nowiki><math> X = 0 </nowiki><nowiki></math></nowiki>下<nowiki><math> Y </nowiki><nowiki></math></nowiki>的单位进行比较的方法不同,我们允许 M 变化但忽略所有使得 M=m 的其他单位。这两个操作除了没有遗漏变量的情况,本质上是不同的,产生不同的结果<ref>Robins, J.M.; Greenland, S. (1992). "Identifiability and exchangeability for direct and indirect effects". ''Epidemiology''. '''3''' (2): 143–155. ''doi'':''10.1097/00001648-199203000-00013''. ''PMID'' ''1576220''.</ref><ref>''Jump up to: '''a''''' '''''b''''' Pearl, Judea (1994). Lopez de Mantaras, R.; Poole, D. (eds.). "A probabilistic calculus of actions". ''Uncertainty in Artificial Intelligence 10''. San Mateo, CA: ''Morgan Kaufmann''. '''1302''': 454–462. ''arXiv'':''1302.6835''. ''Bibcode'':''2013arXiv1302.6835P''.</ref>
+
 
 +
因果方法的基本前提是,当我们试图估计自变量 <nowiki><math>X </nowiki><nowiki></math></nowiki>对因变量 <nowiki><math>Y </nowiki><nowiki></math></nowiki>的直接影响时,并不总是适合对中介M进行“控制”(见上图)。对M进行“控制”的经典理论是,如果我们成功地阻止了M的变化,那么我们在Y中测量的任何变化都只能归因于X的变化,然后我们就有理由宣布观察到的效果是“X<nowiki></math></nowiki>对Y<nowiki></math></nowiki>的直接影响”。不幸的是,“控制M”并不能从物理上阻止M的改变;它只是把分析者的注意力集中在相等<nowiki><math> M </nowiki><nowiki></math></nowiki>值的情况下。而且,概率论的语言没有表示“阻止M改变”或“物理上保持M不变”的符号。唯一的运算是“以…为条件”(conditioning),这是当我们“控制” <nowiki><math>M </nowiki><nowiki></math></nowiki>时所做的。或者为 Y<nowiki></math></nowiki> 的方程添加 M <nowiki></math></nowiki>作为其中的一个回归变量。 结果是,与在物理上保持 M <nowiki></math></nowiki>不变(例如 M = m )并将 X = 1<nowiki></math></nowiki> 下 Y<nowiki></math></nowiki> 的单位 与<nowiki><math> X = 0 </nowiki><nowiki></math></nowiki>下<nowiki><math> Y </nowiki><nowiki></math></nowiki>的单位进行比较的方法不同,我们允许 M 变化但忽略所有使得 M=m 的其他单位。这两个操作除了没有遗漏变量的情况,本质上是不同的,产生不同的结果<ref>Robins, J.M.; Greenland, S. (1992). "Identifiability and exchangeability for direct and indirect effects". ''Epidemiology''. '''3''' (2): 143–155. ''doi'':''10.1097/00001648-199203000-00013''. ''PMID'' ''1576220''.</ref><ref name=":1">''Jump up to: '''a''''' '''''b''''' Pearl, Judea (1994). Lopez de Mantaras, R.; Poole, D. (eds.). "A probabilistic calculus of actions". ''Uncertainty in Artificial Intelligence 10''. San Mateo, CA: ''Morgan Kaufmann''. '''1302''': 454–462. ''arXiv'':''1302.6835''. ''Bibcode'':''2013arXiv1302.6835P''.</ref>
    
举例来说,假设<nowiki><math> M </nowiki><nowiki></math></nowiki>和<nowiki><math> Y</nowiki><nowiki></math></nowiki> 的误差项是相关的。在这种情况下,通过对 <nowiki><math>Y </nowiki><nowiki></math></nowiki>在 <nowiki><math>X</nowiki><nowiki></math></nowiki> 和 <nowiki><math>M </nowiki><nowiki></math></nowiki>上进行回归,就无法对结构系数<nowiki><math> B </nowiki><nowiki></math></nowiki>和 <nowiki><math>A</nowiki><nowiki></math></nowiki>(在<nowiki><math>M</nowiki><nowiki></math></nowiki>和<nowiki><math>Y</nowiki><nowiki></math></nowiki>之间,在<nowiki><math>Y</nowiki><nowiki></math></nowiki>和<nowiki><math>X</nowiki><nowiki></math></nowiki>之间) 进行估计。事实上,即使当 <nowiki><math>C</nowiki><nowiki></math></nowiki> 等于 0 的时候,回归斜率也可能不等于 0 。这有两种后果。首先必须设计新的策略来估计结构系数 <nowiki><math>A</nowiki><nowiki></math></nowiki>、<nowiki><math>B</nowiki><nowiki></math></nowiki> 和 <nowiki><math>C</nowiki><nowiki></math></nowiki>。其次,直接和间接效应的基本定义必须超越回归分析,并且应该采用类似于“固定 <nowiki><math>M</nowiki><nowiki></math></nowiki>”的操作,而不是“在<nowiki><math> M </nowiki><nowiki></math></nowiki>的条件下”的操作。
 
举例来说,假设<nowiki><math> M </nowiki><nowiki></math></nowiki>和<nowiki><math> Y</nowiki><nowiki></math></nowiki> 的误差项是相关的。在这种情况下,通过对 <nowiki><math>Y </nowiki><nowiki></math></nowiki>在 <nowiki><math>X</nowiki><nowiki></math></nowiki> 和 <nowiki><math>M </nowiki><nowiki></math></nowiki>上进行回归,就无法对结构系数<nowiki><math> B </nowiki><nowiki></math></nowiki>和 <nowiki><math>A</nowiki><nowiki></math></nowiki>(在<nowiki><math>M</nowiki><nowiki></math></nowiki>和<nowiki><math>Y</nowiki><nowiki></math></nowiki>之间,在<nowiki><math>Y</nowiki><nowiki></math></nowiki>和<nowiki><math>X</nowiki><nowiki></math></nowiki>之间) 进行估计。事实上,即使当 <nowiki><math>C</nowiki><nowiki></math></nowiki> 等于 0 的时候,回归斜率也可能不等于 0 。这有两种后果。首先必须设计新的策略来估计结构系数 <nowiki><math>A</nowiki><nowiki></math></nowiki>、<nowiki><math>B</nowiki><nowiki></math></nowiki> 和 <nowiki><math>C</nowiki><nowiki></math></nowiki>。其次,直接和间接效应的基本定义必须超越回归分析,并且应该采用类似于“固定 <nowiki><math>M</nowiki><nowiki></math></nowiki>”的操作,而不是“在<nowiki><math> M </nowiki><nowiki></math></nowiki>的条件下”的操作。
 
===数学定义===
 
===数学定义===
   −
Pearl(1994)[22]中定义了这样一个运算符 <math>do(M = m)</math>,它的作用是去除 M<nowiki></math></nowiki> 的方程,代之以一个常数 m<nowiki></math></nowiki>。例如,如果基本中介模型由以下方程组成:
+
Pearl(1994)<<ref name=":1" />中定义了这样一个运算符 <math>do(M = m)</math>,它的作用是去除 M<nowiki></math></nowiki> 的方程,代之以一个常数 m<nowiki></math></nowiki>。例如,如果基本中介模型由以下方程组成:
 
<math> {\displaystyle X=f(\varepsilon _{1}),M=g(X,\varepsilon _{2}),Y=h(X,M,\varepsilon _{3}),}</math>
 
<math> {\displaystyle X=f(\varepsilon _{1}),M=g(X,\varepsilon _{2}),Y=h(X,M,\varepsilon _{3}),}</math>
 
那么应用了<math>do(M = m)<math>运算的模型将会变为:
 
那么应用了<math>do(M = m)<math>运算的模型将会变为:
第59行: 第60行:  
同时,应用了<math>do(X = x)<math> 运算的模型会变为:
 
同时,应用了<math>do(X = x)<math> 运算的模型会变为:
 
<math>{\displaystyle X=x,M=g(x,\varepsilon _{2}),Y=h(x,M,\varepsilon _{3})}</math>
 
<math>{\displaystyle X=x,M=g(x,\varepsilon _{2}),Y=h(x,M,\varepsilon _{3})}</math>
其中函数 f 和 g 以及误差项 ε1 <nowiki></math></nowiki>和 ε3 <nowiki></math></nowiki>的分布保持不变。如果我们进一步将 <math>do(X = x)</math>得到的变量 <math>M</math> 和 <math>Y</math> 分别重新命名为 <math>M(x)</math>和 <math>Y(x)</math> ,我们得到了所谓的“潜在结果(potential outcome)”[24]或“结构反事实(structural counterfactuals)”<ref>Rubin, D.B. (1974). ''"Estimating causal effects of treatments in randomized and nonrandomized studies"''. ''Journal of Educational Psychology''. '''66''' (5): 688–701. ''doi'':''10.1037/h0037350''.</ref>
+
其中函数 f 和 g 以及误差项<nowiki><math> ε1 </nowiki><nowiki></math></nowiki>和 <nowiki><math> ε3 </nowiki><nowiki></math></nowiki>的分布保持不变。如果我们进一步将 <math>do(X = x)</math>得到的变量 <math>M</math> 和 <math>Y</math> 分别重新命名为 <math>M(x)</math>和 <math>Y(x)</math> ,我们得到了所谓的“潜在结果(potential outcome)”<ref>Rubin, D.B. (1974). ''"Estimating causal effects of treatments in randomized and nonrandomized studies"''. ''Journal of Educational Psychology''. '''66''' (5): 688–701. ''doi'':''10.1037/h0037350''.</ref>或“结构反事实(structural counterfactuals)”<ref>Balke, A.; Pearl, J. (1995). Besnard, P.; Hanks, S. (eds.). "Counterfactuals and Policy Analysis in Structural Models". ''Uncertainty in Artificial Intelligence 11''. San Francisco, CA: ''Morgan Kaufmann''. '''1302''': 11–18. ''arXiv'':''1302.4929''. ''Bibcode'':''2013arXiv1302.4929B''.</ref>
 +
 
      第67行: 第69行:  
'''(a) 总体效应 –'''
 
'''(a) 总体效应 –'''
 
<math>TE=E[Y(1)-Y(0)]</math>
 
<math>TE=E[Y(1)-Y(0)]</math>
 +
 
'''(b) 受控直接效应 -'''
 
'''(b) 受控直接效应 -'''
 
<math>CDE(m)=E[Y(1,m)-Y(0,m)]</math>
 
<math>CDE(m)=E[Y(1,m)-Y(0,m)]</math>
 +
 
'''(c) 自然直接效应 -'''
 
'''(c) 自然直接效应 -'''
 
<math>NDE=E[Y(1,M(0))-Y(0,M(0))]</math>
 
<math>NDE=E[Y(1,M(0))-Y(0,M(0))]</math>
 +
 
'''(d) 自然间接效应'''
 
'''(d) 自然间接效应'''
 
<math>NIE = E [Y(0,M(1)) - Y(0,M(0))] </math>
 
<math>NIE = E [Y(0,M(1)) - Y(0,M(0))] </math>
 +
 +
 
其中 <math>E[\cdot ]</math> 表示对误差项的期望,这些效应有如下一些解释:
 
其中 <math>E[\cdot ]</math> 表示对误差项的期望,这些效应有如下一些解释:
 
- <math>TE</math> 表示的 <math>X</math>对 <math>Y</math>的总体因果效应。
 
- <math>TE</math> 表示的 <math>X</math>对 <math>Y</math>的总体因果效应。

导航菜单