更改

跳到导航 跳到搜索
添加510字节 、 2021年6月10日 (四) 12:00
无编辑摘要
第8行: 第8行:  
1)让因变量对自变量进行回归,以确认自变量是因变量的显著预测因子,即
 
1)让因变量对自变量进行回归,以确认自变量是因变量的显著预测因子,即
 
<math>Y=\beta _{{10}}+\beta _{{11}}X+\varepsilon _{1}</math>
 
<math>Y=\beta _{{10}}+\beta _{{11}}X+\varepsilon _{1}</math>
的回归系数$$β_{11}$$ 是显著的。
+
的回归系数<math>β_{11}<math> 是显著的。
 
2)让中介变量对自变量进行回归,确认自变量是中介变量的显著预测因子,即
 
2)让中介变量对自变量进行回归,确认自变量是中介变量的显著预测因子,即
$$Me=\beta _{{20}}+\beta _{{21}}X+\varepsilon _{2}$$
+
<math>Me=\beta _{{20}}+\beta _{{21}}X+\varepsilon _{2}<math>
的回归系数 $$\beta_{21}$$是显著的。如果中介变量与自变量没有关联,那么它就不可能中介任何事物。
+
的回归系数 <math>\beta_{21}<math>是显著的。如果中介变量与自变量没有关联,那么它就不可能中介任何事物。
 
3)让因变量对中介和自变量同时进行回归,即
 
3)让因变量对中介和自变量同时进行回归,即
$$Y=\beta _{{30}}+\beta _{{31}}X+\beta _{{32}}Me+\varepsilon _{3}$$
+
<math>Y=\beta _{{30}}+\beta _{{31}}X+\beta _{{32}}Me+\varepsilon _{3}<math>
的回归系数 $$\beta_{32}$$是显著的,并且 $$\beta_{31}$$的绝对值应该小于自变量的效应 $$\beta_{11}$$。从而确保了中介变量是因变量的重要预测因子,并且使得相对于第一步,自变量对结果的解释性降低。
+
的回归系数 <math>\beta_{32}<math>是显著的,并且 <math>\beta_{31}<math>的绝对值应该小于自变量的效应 <math>\beta_{11}<math>。从而确保了中介变量是因变量的重要预测因子,并且使得相对于第一步,自变量对结果的解释性降低。
    
中介变量可以解释两个变量之间观察到的全部或部分关系,如果中介变量的加入使自变量和因变量之间的相关性降为零,则中介的证据最大,也称为完全中介(full mediation)。而部分中介(partial mediation)是指不仅中介变量与因变量之间存在显著的关系,而且自变量与因变量之间也存在某种直接的关系。
 
中介变量可以解释两个变量之间观察到的全部或部分关系,如果中介变量的加入使自变量和因变量之间的相关性降为零,则中介的证据最大,也称为完全中介(full mediation)。而部分中介(partial mediation)是指不仅中介变量与因变量之间存在显著的关系,而且自变量与因变量之间也存在某种直接的关系。
第34行: 第34行:  
数学定义
 
数学定义
   −
Pearl(1994)[22]中定义了这样一个运算符 $$do(M = m)$$,它的作用是去除 M 的方程,代之以一个常数 m。例如,如果基本中介模型由以下方程组成:
+
Pearl(1994)[22]中定义了这样一个运算符 <math>do(M = m)<math>,它的作用是去除 M 的方程,代之以一个常数 m。例如,如果基本中介模型由以下方程组成:
$$ {\displaystyle X=f(\varepsilon _{1}),M=g(X,\varepsilon _{2}),Y=h(X,M,\varepsilon _{3}),}$$
+
<math> {\displaystyle X=f(\varepsilon _{1}),M=g(X,\varepsilon _{2}),Y=h(X,M,\varepsilon _{3}),}<math>
那么应用了$$do(M = m)$$运算的模型将会变为:
+
那么应用了<math>do(M = m)<math>运算的模型将会变为:
$${\displaystyle X=f(\varepsilon _{1}),M=m,Y=h(X,m,\varepsilon _{3})}$$
+
<math>{\displaystyle X=f(\varepsilon _{1}),M=m,Y=h(X,m,\varepsilon _{3})}<math>
同时,应用了$$do(X = x)$$ 运算的模型会变为:
+
同时,应用了<math>do(X = x)<math> 运算的模型会变为:
$${\displaystyle X=x,M=g(x,\varepsilon _{2}),Y=h(x,M,\varepsilon _{3})}$$
+
<math>{\displaystyle X=x,M=g(x,\varepsilon _{2}),Y=h(x,M,\varepsilon _{3})}<math>
其中函数 f 和 g 以及误差项 ε1 和 ε3 的分布保持不变。如果我们进一步将 $$do(X = x)$$ 得到的变量 $$M$$ $$Y$$ 分别重新命名为 $$M(x)$$ $$Y(x)$$ ,我们得到了所谓的“潜在结果(potential outcome)”[24]或“结构反事实(structural counterfactuals)”[25]这些新变量为定义直接和间接效应提供了便利的描述符号。具体来说,定义了从 $$X = 0$$ $$X = 1$$ 变化的四种效应:
+
其中函数 f 和 g 以及误差项 ε1 和 ε3 的分布保持不变。如果我们进一步将 <math>do(X = x)<math> 得到的变量 <math>M<math> <math>Y<math> 分别重新命名为 <math>M(x)<math> <math>Y(x)<math> ,我们得到了所谓的“潜在结果(potential outcome)”[24]或“结构反事实(structural counterfactuals)”[25]这些新变量为定义直接和间接效应提供了便利的描述符号。具体来说,定义了从 <math>X = 0<math> <math>X = 1</math>变化的四种效应:
    
(a) 总体效应 –
 
(a) 总体效应 –
$$TE=E[Y(1)-Y(0)]$$
+
<math>TE=E[Y(1)-Y(0)]</math>
 
(b) 受控直接效应 -
 
(b) 受控直接效应 -
$$CDE(m)=E[Y(1,m)-Y(0,m)]$$
+
<math>CDE(m)=E[Y(1,m)-Y(0,m)]</math>
 
(c) 自然直接效应 -
 
(c) 自然直接效应 -
$$NDE=E[Y(1,M(0))-Y(0,M(0))]$$
+
<math>NDE=E[Y(1,M(0))-Y(0,M(0))]</math>
 
(d) 自然间接效应
 
(d) 自然间接效应
$$NIE = E [Y(0,M(1)) - Y(0,M(0))] $$
+
<math>NIE = E [Y(0,M(1)) - Y(0,M(0))] </math>
其中 $$E[\cdot ]$$ 表示对误差项的期望,这些效应有如下一些解释:
+
其中 <math>E[\cdot ]</math> 表示对误差项的期望,这些效应有如下一些解释:
- $$TE$$ 表示的 $$X$$$$Y$$的总体因果效应。
+
- <math>TE</math> 表示的 <math>X</math><math>Y</math>的总体因果效应。
- $$CDE$$ 表示在某个条件 $$M=m$$下,$$X$$$$Y$$的因果效应。
+
- <math>CDE</math> 表示在某个条件 <math>M=m<math>下,<math>X<math><math>Y</math>的因果效应。
- $$NDE$$ 表示  $$X$$$$Y$$的直接产生的因果效应。
+
- <math>NDE</math> 表示  <math>X<math><math>Y</math>的直接产生的因果效应。
- $$NIE$$ 表示  $$X$$$$Y$$的通过中介变量 $$M$$产生的因果效应。
+
- <math>NIE</math>表示  <math>X<math><math>Y</math>的通过中介变量 <math>M</math>产生的因果效应。
- 对于解释 $$X$$$$Y$$之间的效应,两个效应的差$$TE-NDE$$ 度量的是中介变量在何种程度上是必要的。而 $$NIE$$ 度量的是引入中介变量在充分性。
+
- 对于解释 <math>X</math><math>Y<math>之间的效应,两个效应的差<math>TE-NDE</math> 度量的是中介变量在何种程度上是必要的。而 <math>NIE</math> 度量的是引入中介变量在充分性。
 
间接效应的受控版本并不存在,因为没有办法通过将一个变量固定到一个常量来屏蔽直接效应。
 
间接效应的受控版本并不存在,因为没有办法通过将一个变量固定到一个常量来屏蔽直接效应。
 
根据这些定义,总体效应可以如下分解
 
根据这些定义,总体效应可以如下分解
$$TE=NDE-NIE_{r}$$
+
<math>TE=NDE-NIE_{r}</math>
其中 $$NIE_r$$ 表示在 $$NIE$$ 的定义中进行 $$X = 1$$ $$X = 0$$ 的反向转换;线性系统中总体效应等于直接效应与间接效应之和,即负的反转间接效应等于间接效应 $$-NIE_r = NIE$$。这些定义的力量在于它们的普适性;它们适用于具有任意非线性相互作用,任意干扰之间的依赖关系,以及连续变量和离散变量的模型。
+
其中 <math>NIE_r<math> 表示在 <math>NIE</math> 的定义中进行 <math>X = 1<math> <math>X = 0</math>的反向转换;线性系统中总体效应等于直接效应与间接效应之和,即负的反转间接效应等于间接效应 <math>-NIE_r = NIE</math>。这些定义的力量在于它们的普适性;它们适用于具有任意非线性相互作用,任意干扰之间的依赖关系,以及连续变量和离散变量的模型。
    
中介效应公式
 
中介效应公式
    
在线性分析中,所有的效应由结构系数的乘积决定,给出
 
在线性分析中,所有的效应由结构系数的乘积决定,给出
$${\displaystyle {\begin{aligned}TE&=C+AB\\CDE(m)&=NDE=C,{\text{ independent of }}m\\NIE&=AB.\end{aligned}}}$$
+
<math>{\displaystyle {\begin{aligned}TE&=C+AB\\CDE(m)&=NDE=C,{\text{ independent of }}m\\NIE&=AB.\end{aligned}}}</math>
因此,当模型被识别时,所有的效应都是可估计的。在非线性系统中,估计直接和间接效应需要更严格的条件,如不存在混杂因子(即 $$ε_1、ε_2、ε_3$$ 相互独立),可推导出如下公式
+
因此,当模型被识别时,所有的效应都是可估计的。在非线性系统中,估计直接和间接效应需要更严格的条件,如不存在混杂因子(即 <math>ε_1、ε_2、ε_3</math> 相互独立),可推导出如下公式
$${\displaystyle {\begin{aligned}TE&=E(Y\mid X=1)-E(Y\mid X=0)\\CDE(m)&=E(Y\mid X=1,M=m)-E(Y\mid X=0,M=m)\\NDE&=\sum _{m}[E(Y|X=1,M=m)-E(Y\mid X=0,M=m)]P(M=m\mid X=0)\\NIE&=\sum _{m}[P(M=m\mid X=1)-P(M=m\mid X=0)]E(Y\mid X=0,M=m).\end{aligned}}}$$
+
<math>{\displaystyle {\begin{aligned}TE&=E(Y\mid X=1)-E(Y\mid X=0)\\CDE(m)&=E(Y\mid X=1,M=m)-E(Y\mid X=0,M=m)\\NDE&=\sum _{m}[E(Y|X=1,M=m)-E(Y\mid X=0,M=m)]P(M=m\mid X=0)\\NIE&=\sum _{m}[P(M=m\mid X=1)-P(M=m\mid X=0)]E(Y\mid X=0,M=m).\end{aligned}}}</math>
 
后两个方程被称为中介公式[28][29][30],已成为许多中介研究的估计对象。他们给出了直接和间接效应的无分布假设(distribution-free)表达式,并证明,尽管误差分布和函数 f, g, h 的性质难以确定,中介效应仍然可以通过使用回归方法利用数据来估计。调节中介和中介调节的分析属于因果中介分析的特例。中介公式确定了各种相互作用系数如何贡献于中介的必要和充分成分。
 
后两个方程被称为中介公式[28][29][30],已成为许多中介研究的估计对象。他们给出了直接和间接效应的无分布假设(distribution-free)表达式,并证明,尽管误差分布和函数 f, g, h 的性质难以确定,中介效应仍然可以通过使用回归方法利用数据来估计。调节中介和中介调节的分析属于因果中介分析的特例。中介公式确定了各种相互作用系数如何贡献于中介的必要和充分成分。
 
简单案例
 
简单案例
 
假设模型采用这种形式
 
假设模型采用这种形式
$${\displaystyle {\begin{aligned}X&=\varepsilon _{1}\\M&=b_{0}+b_{1}X+\varepsilon _{2}\\Y&=c_{0}+c_{1}X+c_{2}M+c_{3}XM+\varepsilon _{3}\end{aligned}}}$$
+
<math>{\displaystyle {\begin{aligned}X&=\varepsilon _{1}\\M&=b_{0}+b_{1}X+\varepsilon _{2}\\Y&=c_{0}+c_{1}X+c_{2}M+c_{3}XM+\varepsilon _{3}\end{aligned}}}</math>
其中,参数 $$c_{3}$$ 量化了 M 对 X 对 Y 的影响的修正程度。即使所有参数都是从数据中估计出来的,仍然不清楚是哪些参数组合度量了 X 对 Y 的直接和间接影响,或者,更实际的是,如何评估由中介解释的总体效应 TE 的比例以及应归功于中介效应的 TE 的比例。在线性分析中,前者被 $$b_{1}c_{2}/TE$$ 所捕获,后者被差值 $$(TE-c_{1})/TE$$ 所捕获,并且这两个量重合。然而,在存在交互的情况下,每个部分都需要单独的分析。如中介公式所规定的那样,其结果是:
+
其中,参数 <math>c_{3}</math> 量化了 M 对 X 对 Y 的影响的修正程度。即使所有参数都是从数据中估计出来的,仍然不清楚是哪些参数组合度量了 X 对 Y 的直接和间接影响,或者,更实际的是,如何评估由中介解释的总体效应 TE 的比例以及应归功于中介效应的 TE 的比例。在线性分析中,前者被 <math>b_{1}c_{2}/TE</math>所捕获,后者被差值 <math>(TE-c_{1})/TE</math> 所捕获,并且这两个量重合。然而,在存在交互的情况下,每个部分都需要单独的分析。如中介公式所规定的那样,其结果是:
$${\begin{aligned}NDE&=c_{1}+b_{0}c_{3}\\NIE&=b_{1}c_{2}\\TE&=c_{1}+b_{0}c_{3}+b_{1}(c_{2}+c_{3})\\&=NDE+NIE+b_{1}c_{3}.\end{aligned}}$$
+
<math>{\begin{aligned}NDE&=c_{1}+b_{0}c_{3}\\NIE&=b_{1}c_{2}\\TE&=c_{1}+b_{0}c_{3}+b_{1}(c_{2}+c_{3})\\&=NDE+NIE+b_{1}c_{3}.\end{aligned}}</math>
 
因此,对于中介变量来说足够输出的部分是
 
因此,对于中介变量来说足够输出的部分是
$${\displaystyle {\frac {NIE}{TE}}={\frac {b_{1}c_{2}}{c_{1}+b_{0}c_{3}+b_{1}(c_{2}+c_{3})}},}$$
+
<math>{\displaystyle {\frac {NIE}{TE}}={\frac {b_{1}c_{2}}{c_{1}+b_{0}c_{3}+b_{1}(c_{2}+c_{3})}},}</math>
    
而需要中介的部分是
 
而需要中介的部分是
$${\displaystyle 1-{\frac {NDE}{TE}}={\frac {b_{1}(c_{2}+c_{3})}{c_{1}+b_{0}c_{3}+b_{1}(c_{2}+c_{3})}}.}$$
+
<math>{\displaystyle 1-{\frac {NDE}{TE}}={\frac {b_{1}(c_{2}+c_{3})}{c_{1}+b_{0}c_{3}+b_{1}(c_{2}+c_{3})}}.}</math>
   −
这些分数涉及模型参数的微妙的组合,并且可以在中介公式的帮助下机械地构造。值得注意的是,由于交互作用,即使参数 $$c_{1}$$ 为 0,直接效应也可以存在。而且,即使直接和间接效应都为 0,总效应也可以存在。 这说明孤立地估计参数几乎无法告诉我们中介的效果。更一般地说,中介和调节是交织在一起的,不能分开评估。
+
这些分数涉及模型参数的微妙的组合,并且可以在中介公式的帮助下机械地构造。值得注意的是,由于交互作用,即使参数 <math>c_{1}</math> 为 0,直接效应也可以存在。而且,即使直接和间接效应都为 0,总效应也可以存在。 这说明孤立地估计参数几乎无法告诉我们中介的效果。更一般地说,中介和调节是交织在一起的,不能分开评估。

导航菜单