更改

大小无更改 、 2021年6月9日 (三) 11:29
第4行: 第4行:     
'''<font color="#ff8000">处理 (Treatment)</font>'''一词起源于农业和医药领域的早期统计分析,现在被更广泛地用于自然科学和社会科学的其他领域,尤其是心理学、政治科学和经济学,例如评价公共政策的影响。试验中的处理或'''<font color="#ff8000">结果 (Outcome)</font>'''的具体内容在评估平均处理效应时相对而言并不重要,也就是说,平均处理效应估算要求对某些个体进行处理,但不处理其他个体,但处理具体内容(例如药物、奖励性支付、政治广告)与平均处理效应的定义和估计无关。
 
'''<font color="#ff8000">处理 (Treatment)</font>'''一词起源于农业和医药领域的早期统计分析,现在被更广泛地用于自然科学和社会科学的其他领域,尤其是心理学、政治科学和经济学,例如评价公共政策的影响。试验中的处理或'''<font color="#ff8000">结果 (Outcome)</font>'''的具体内容在评估平均处理效应时相对而言并不重要,也就是说,平均处理效应估算要求对某些个体进行处理,但不处理其他个体,但处理具体内容(例如药物、奖励性支付、政治广告)与平均处理效应的定义和估计无关。
 +
    
“处理效应”一词是指某一特定处理或干预 (如给予某种药物)对结果变量(如病人的康复)的'''<font color="#ff8000">因果影响 (Causal Effect)</font>'''。在因果关系的 Neyman-Rubin“[[潜在结果框架]]”中,处理效应被定义为每个独立个体的两个“潜在结果”,如果该个体给与处理,就会显现一种结果; 如果该个体不给予处理,就会显现出另一种结果。“处理效果”是这两种潜在结果之间的差异。然而,这种个体水平的处理效果是不可观察到的,因为每个独立个体只能接受处理或不接受处理,但不能同时接受和不接受。随机分配需要确保给处理组的个体和对照组的个体在大量迭代实验上是服从同分布。事实上,两组中的个体在协变量和潜在结果上的分布是相同的。因此,处理个体之间的平均结果是控制个体的平均结果的反事实。这两个平均值之间的差异是平均处理效应 ,这是不可观测到的个体层面的处理效果的中心趋势的估计。<ref>{{cite journal |last=Holland |first=Paul W. |year=1986 |title=Statistics and Causal Inference |journal=Journal of the American Statistical Association|volume=81 |issue=396 |pages=945–960 |jstor=2289064 }}</ref>如果样本是从总体中随机构成,那么'''<font color="#ff8000">样本平均处理效应 (Sample Average Treatment Effect, SATE)</font>'''也是'''<font color="#ff8000">总体平均处理效应 (Population Average Treatment Effect,PATE)</font>'''的估计值。<ref>{{cite journal |last=Imai |first=Kosuke |first2=Gary |last2=King |first3=Elizabeth A. |last3=Stuart |year=2008 |title=Misunderstandings Between Experimentalists and Observationalists About Causal Inference |journal=Journal of the Royal Statistical Society, Series |volume=171 |issue=2 |pages=481–502 |url=http://nrs.harvard.edu/urn-3:HUL.InstRepos:4142695 }}</ref>
 
“处理效应”一词是指某一特定处理或干预 (如给予某种药物)对结果变量(如病人的康复)的'''<font color="#ff8000">因果影响 (Causal Effect)</font>'''。在因果关系的 Neyman-Rubin“[[潜在结果框架]]”中,处理效应被定义为每个独立个体的两个“潜在结果”,如果该个体给与处理,就会显现一种结果; 如果该个体不给予处理,就会显现出另一种结果。“处理效果”是这两种潜在结果之间的差异。然而,这种个体水平的处理效果是不可观察到的,因为每个独立个体只能接受处理或不接受处理,但不能同时接受和不接受。随机分配需要确保给处理组的个体和对照组的个体在大量迭代实验上是服从同分布。事实上,两组中的个体在协变量和潜在结果上的分布是相同的。因此,处理个体之间的平均结果是控制个体的平均结果的反事实。这两个平均值之间的差异是平均处理效应 ,这是不可观测到的个体层面的处理效果的中心趋势的估计。<ref>{{cite journal |last=Holland |first=Paul W. |year=1986 |title=Statistics and Causal Inference |journal=Journal of the American Statistical Association|volume=81 |issue=396 |pages=945–960 |jstor=2289064 }}</ref>如果样本是从总体中随机构成,那么'''<font color="#ff8000">样本平均处理效应 (Sample Average Treatment Effect, SATE)</font>'''也是'''<font color="#ff8000">总体平均处理效应 (Population Average Treatment Effect,PATE)</font>'''的估计值。<ref>{{cite journal |last=Imai |first=Kosuke |first2=Gary |last2=King |first3=Elizabeth A. |last3=Stuart |year=2008 |title=Misunderstandings Between Experimentalists and Observationalists About Causal Inference |journal=Journal of the Royal Statistical Society, Series |volume=171 |issue=2 |pages=481–502 |url=http://nrs.harvard.edu/urn-3:HUL.InstRepos:4142695 }}</ref>
第9行: 第10行:     
虽然实验确保了潜在结果以及所有协变量在处理组和对照组中的等价分布,但是在观察性研究中,情况并非如此。在观察性研究中,处理组和对照组个体并不服从随机分布,因此处理个体可能取决于未观测到或不可观测的因素。观察到的因素可以在统计学上加以控制 (如通过回归或匹配) ,但是任何关于平均处理效应的估计都可能与不可观察因素混淆,这些因素影响了哪些个体接受了处理,哪些个体没有接受处理。
 
虽然实验确保了潜在结果以及所有协变量在处理组和对照组中的等价分布,但是在观察性研究中,情况并非如此。在观察性研究中,处理组和对照组个体并不服从随机分布,因此处理个体可能取决于未观测到或不可观测的因素。观察到的因素可以在统计学上加以控制 (如通过回归或匹配) ,但是任何关于平均处理效应的估计都可能与不可观察因素混淆,这些因素影响了哪些个体接受了处理,哪些个体没有接受处理。
      
== 形式化定义 Formal definition ==
 
== 形式化定义 Formal definition ==