更改

跳到导航 跳到搜索
添加85字节 、 2021年6月10日 (四) 09:58
无编辑摘要
第4行: 第4行:  
|因果科学,因果推断=}}
 
|因果科学,因果推断=}}
   −
在[[统计学]]中,'''可忽略性'''是实验设计的一种特征,即数据收集方式(以及缺失数据的性质)不依赖于缺失数据。若在给定已观测数据的条件下,表示哪些变量被观测到或缺失的缺失数据指示矩阵与缺失数据独立,则称该数据缺失机制(例如处理分配或抽样调查策略)是“可忽略的”。
+
在统计学中,'''可忽略性'''是实验设计的一种特征,即数据收集方式(以及缺失数据的性质)不依赖于缺失数据。若在给定已观测数据的条件下,表示哪些变量被观测到或缺失的缺失数据指示矩阵与缺失数据独立,则称该数据缺失机制(例如处理分配或抽样调查策略)是“可忽略的”。
      −
这个想法是20世纪70年代早期[[Donald Rubin]]和[[Paul R. Rosenbaum|Paul Rosenbaum]] 合作提出的[[鲁宾因果推理模型 Rubin Causal Model]]的一部分。但那时,他们文章中可忽略性的确切定义不同。1978年鲁宾在一篇文章中讨论了可忽略的分配机制<ref name="rubin78">{{cite journal |last1=Rubin |first1=Donald |title=Bayesian Inference for Causal Effects: The Role of Randomization |journal=The Annals of Statistics |date=1978 |volume=6 |issue=1 |pages=34–58|doi=10.1214/aos/1176344064 |doi-access=free }}</ref> ,其可理解为将个体分配到处理组的方式与数据分析无关,因为已经记录了有关该个体的所有信息。后来,在 1983 年,Rubin 和 Rosenbaum 更确切地定义了“处理分配的强可忽略性”<ref>{{cite journal |last1=Rubin |first1=Donald B. |last2=Rosenbaum |first2=Paul R. |title=The Central Role of the Propensity Score in Observational Studies for Causal Effects |journal=Biometrika |date=1983 |volume=70 |issue=1 |pages=41–55 |doi=10.2307/2335942 |jstor=2335942 |doi-access=free }}</ref>,这是一个更强的假设条件,数学上表示为<math>(r_1,r_0) \perp \!\!\!\perp z \mid v ,\quad 0<\operatorname{pr}(z=1)<1 \quad \forall v</math>,其中<math>r_t</math>是给定处理状态 <math>t</math>下的潜在结果,<math>v</math> 是协变量,<math>z</math> 是实际的处理状态。
+
这个想法是20世纪70年代早期[[Donald Rubin]]和Paul Rosenbaum 合作提出的[[鲁宾因果推理模型 Rubin Causal Model]]的一部分。但那时,他们文章中可忽略性的确切定义不同。1978年鲁宾在一篇文章中讨论了可忽略的分配机制<ref name="rubin78">{{cite journal |last1=Rubin |first1=Donald |title=Bayesian Inference for Causal Effects: The Role of Randomization |journal=The Annals of Statistics |date=1978 |volume=6 |issue=1 |pages=34–58|doi=10.1214/aos/1176344064 |doi-access=free }}</ref> ,其可理解为将个体分配到处理组的方式与数据分析无关,因为已经记录了有关该个体的所有信息。后来,在 1983 年,Rubin 和 Rosenbaum 更确切地定义了“处理分配的强可忽略性”<ref>{{cite journal |last1=Rubin |first1=Donald B. |last2=Rosenbaum |first2=Paul R. |title=The Central Role of the Propensity Score in Observational Studies for Causal Effects |journal=Biometrika |date=1983 |volume=70 |issue=1 |pages=41–55 |doi=10.2307/2335942 |jstor=2335942 |doi-access=free }}</ref>,这是一个更强的假设条件,数学上表示为<math>(r_1,r_0) \perp \!\!\!\perp z \mid v ,\quad 0<\operatorname{pr}(z=1)<1 \quad \forall v</math>,其中<math>r_t</math>是给定处理状态 <math>t</math>下的潜在结果,<math>v</math> 是协变量,<math>z</math> 是实际的处理状态。
      第14行: 第14行:     
== 定义 ==
 
== 定义 ==
可忽略性(或外生性)的简明含义是,当涉及潜在结果[math](Y)[/math]时,我们可以忽略一个人是怎样最终处于一个群体中而非另一个群体中(“处理组”Tx = 1,或“控制组”Tx = 0)。它也被称为无混淆杂性、基于可观测变量的选择或无遗漏变量偏差<ref>{{cite journal|last1=Yamamoto|first1=Teppei|title=Understanding the Past: Statistical Analysis of Causal Attribution|journal=Journal of Political Science|date=2012|volume=56|issue=1|pages=237–256|doi=10.1111/j.1540-5907.2011.00539.x|hdl=1721.1/85887}}</ref>。
+
可忽略性(或外生性)的简明含义是,当涉及潜在结果[math](Y)[/math]时,我们可以忽略一个人是怎样最终处于一个群体中而非另一个群体中(“处理组”[math]Tx = 1[math],或“控制组”[math]Tx = 0)[math]。它也被称为无混淆杂性、基于可观测变量的选择或无遗漏变量偏差<ref>{{cite journal|last1=Yamamoto|first1=Teppei|title=Understanding the Past: Statistical Analysis of Causal Attribution|journal=Journal of Political Science|date=2012|volume=56|issue=1|pages=237–256|doi=10.1111/j.1540-5907.2011.00539.x|hdl=1721.1/85887}}</ref>。
      −
其数学形式可记为:[Y<sub>i</sub>1, Y<sub>i</sub>0] ⊥ Tx<sub>i</sub> ;或者用文字表述为:个体“i”是否接受处理的潜在结果Y并不取决于他们是否真的(可观测到的)接受处理。换句话说,个体最终是通过什么方式处于一种与另一种处理状态我们是可忽略的,并将其潜在结果视为等价可交换的。 虽然这看起来很复杂,但如果用下标表示“已实现”的真实处理状态,用上标表示“理想”(潜在)世界的处理状态,就会变得很清楚。(符号的提出可参考[https://www.cambridge.org/core/books/statistical-models-and-causal-inference/7CE8D4957FF6E9615AAAC4128FA8246E David Freedman];可视化帮助文档可参考:[https://drive.google.com/open?id=1nLHHH0il225LIy33nRiH3ZfgoX1_-_V9 potential outcomes simplified])。
      +
其数学形式可记为:[math][Y<sub>i</sub>1, Y<sub>i</sub>0] ⊥ Tx<sub>i</sub> ];或者用文字表述为:个体[math]“i”是否接受处理的潜在结果Y并不取决于他们是否真的(可观测到的)接受处理。换句话说,个体最终是通过什么方式处于一种与另一种处理状态我们是可忽略的,并将其潜在结果视为等价可交换的。 虽然这看起来很复杂,但如果用下标表示“已实现”的真实处理状态,用上标表示“理想”(潜在)世界的处理状态,就会变得很清楚。(符号的提出可参考[https://www.cambridge.org/core/books/statistical-models-and-causal-inference/7CE8D4957FF6E9615AAAC4128FA8246E David Freedman];可视化帮助文档可参考:[https://drive.google.com/open?id=1nLHHH0il225LIy33nRiH3ZfgoX1_-_V9 potential outcomes simplified])。
   −
所以,如果个体接受处理(上角标为 <sup>1</sup>),其对应的潜在结果Y为Y<sub>1</sub><sup>1</sup>/*Y<sub>0</sub><sup>1</sup>,实际上它们可观测的结果是(Y<sub>1</sub><sup>1</sup>, 下角标也为 <sub>1</sub>) ,而不是*Y<sub>0</sub><sup>1</sup>。注意:* 表示这个值是无法获取或不可观测的,即''完全与事实相反''或称为反事实 counterfactual(CF)。
      +
所以,如果个体接受处理(上角标为 <sup>1</sup>),其对应的潜在结果[math]Y为[math]Y<sub>1</sub><sup>1</sup>/*Y<sub>0</sub><sup>1</sup>,实际上它们可观测的结果是([math]Y<sub>1</sub><sup>1</sup>, 下角标也为 <sub>1</sub>) ,而不是[math]*Y<sub>0</sub><sup>1</sup>。注意:* 表示这个值是无法获取或不可观测的,即''完全与事实相反''或称为反事实 counterfactual(CF)。
   −
同样,如果个体未接受处理(上角标为 <sup>0</sup>), 其对应的潜在结果Y为*Y<sub>1</sub><sup>0</sup>/Y<sub>0</sub><sup>0</sup>。在现实中它们是(Y<sub>0</sub><sup>0</sup>),而不是(*Y<sub>1</sub><sup>0</sup>)。
+
 
 +
同样,如果个体未接受处理(上角标为 <sup>0</sup>), 其对应的潜在结果[math]Y为*[math]Y<sub>1</sub><sup>0</sup>/Y<sub>0</sub><sup>0</sup>。在现实中它们是[math](Y<sub>0</sub><sup>0</sup>),而不是[math](*Y<sub>1</sub><sup>0</sup>)。
      第29行: 第30行:       −
由于“一致性准则 consistency rule”,潜在结果可利用实际观测值表示:Y<sub>i</sub><sup>0</sup> = Y<sub>i0</sub><sup>0</sup> ; Y<sub>i</sub><sup>1</sup> = Y<sub>i1</sub><sup>1</sup>(“一致性准则指出,个体的潜在结果正是该个体的实际产生结果<ref>{{cite journal|last1=Pearl|first1=Judea|title=On the consistency rule in causal inference: axiom, definition, assumption, or theorem?|journal=Epidemiology|date=2010|volume=21|issue=6|pages=872–875|doi=10.1097/EDE.0b013e3181f5d3fd|pmid=20864888}}</ref> p.&nbsp;872)。 所以,TE = E[Y<sub>i</sub><sup>1</sup> – Y<sub>i</sub><sup>0</sup>] = E[Y<sub>i1</sub><sup>1</sup> – Y<sub>i0</sub><sup>0</sup>]。
+
 
 +
由于“一致性准则 consistency rule”,潜在结果可利用实际观测值表示:[math]Y<sub>i</sub><sup>0</sup> = Y<sub>i0</sub><sup>0</sup> ; [math]Y<sub>i</sub><sup>1</sup> = Y<sub>i1</sub><sup>1</sup>(“一致性准则指出,个体的潜在结果正是该个体的实际产生结果<ref>{{cite journal|last1=Pearl|first1=Judea|title=On the consistency rule in causal inference: axiom, definition, assumption, or theorem?|journal=Epidemiology|date=2010|volume=21|issue=6|pages=872–875|doi=10.1097/EDE.0b013e3181f5d3fd|pmid=20864888}}</ref> p.&nbsp;872)。 所以,[math]TE = E[Y<sub>i</sub><sup>1</sup> – Y<sub>i</sub><sup>0</sup>] = E[Y<sub>i1</sub><sup>1</sup> – Y<sub>i0</sub><sup>0</sup>]。
       
现在,我们通过简单的加减相同的完全反事实量 *Y<sub>1</sub><sup>0</sup> 得到:
 
现在,我们通过简单的加减相同的完全反事实量 *Y<sub>1</sub><sup>0</sup> 得到:
   −
E[Y<sub>i1</sub><sup>1</sup> – Y<sub>i0</sub><sup>0</sup>] = E[Y<sub>i1</sub><sup>1</sup> –*Y<sub>1</sub><sup>0</sup>  +*Y<sub>1</sub><sup>0</sup> - Y<sub>i0</sub><sup>0</sup>] = E[Y<sub>i1</sub><sup>1</sup> –*Y<sub>1</sub><sup>0</sup>] + E[*Y<sub>1</sub><sup>0</sup> - Y<sub>i0</sub><sup>0</sup>] = ATT + {选择性偏差},
+
[math]E[Y<sub>i1</sub><sup>1</sup> – Y<sub>i0</sub><sup>0</sup>] = E[Y<sub>i1</sub><sup>1</sup> –*Y<sub>1</sub><sup>0</sup>  +*Y<sub>1</sub><sup>0</sup> - Y<sub>i0</sub><sup>0</sup>] = E[Y<sub>i1</sub><sup>1</sup> –*Y<sub>1</sub><sup>0</sup>] + E[*Y<sub>1</sub><sup>0</sup> - Y<sub>i0</sub><sup>0</sup>] = ATT + {选择性偏差},
     

导航菜单