第9行: |
第9行: |
| | | |
| | | |
− | “处理效应”一词是指某一特定处理或干预 (如给予某种药物)对结果变量(如病人的康复)的'''<font color="#ff8000">因果影响 (Causal Effect)</font>'''。在因果关系的 Neyman-Rubin“[[潜在结果框架]]”中,处理效应被定义为每个独立个体的两个“潜在结果”,如果该个体给与处理,就会显现一种结果; 如果该个体不给予处理,就会显现出另一种结果。“处理效果”是这两种潜在结果之间的差异。然而,这种个体水平的处理效果是不可观察到的,因为每个独立个体只能接受处理或不接受处理,但不能同时接受和不接受。随机分配需要确保给处理组的个体和对照组的个体在大量迭代实验上是服从同分布。事实上,两组中的个体在协变量和潜在结果上的分布是相同的。因此,处理个体之间的平均结果是控制个体的平均结果的反事实。这两个平均值之间的差异是平均处理效应 ,这是不可观测到的个体层面的处理效果的中心趋势的估计。<ref>{{cite journal |last=Holland |first=Paul W. |year=1986 |title=Statistics and Causal Inference |journal=Journal of the American Statistical Association|volume=81 |issue=396 |pages=945–960 |jstor=2289064 }}</ref>如果样本是从总体中随机构成,那么'''<font color="#ff8000">样本平均处理效应 (Sample Average Treatment Effect, SATE)</font>'''也是'''<font color="#ff8000">总体平均处理效应 (Population Average Treatment Effect,PATE)</font>'''的估计值。<ref>{{cite journal |last=Imai |first=Kosuke |first2=Gary |last2=King |first3=Elizabeth A. |last3=Stuart |year=2008 |title=Misunderstandings Between Experimentalists and Observationalists About Causal Inference |journal=Journal of the Royal Statistical Society, Series |volume=171 |issue=2 |pages=481–502 |url=http://nrs.harvard.edu/urn-3:HUL.InstRepos:4142695 }}</ref> | + | “处理效应”一词是指某一特定处理或干预 (如给予某种药物)对结果变量(如病人的康复)的'''<font color="#ff8000">因果影响 (Causal Effect)</font>'''。在因果关系的 Neyman-Rubin“[[潜在结果框架]]”中,处理效应被定义为每个独立个体的两个“潜在结果”,如果该个体给予处理,就会显现一种结果; 如果该个体不给予处理,就会显现出另一种结果。“处理效果”是这两种潜在结果之间的差异。然而,这种个体水平的处理效果是不可观察到的,因为每个独立个体只能接受处理或不接受处理,但不能同时接受和不接受。随机分配需要确保给处理组的个体和对照组的个体在大量迭代实验上是服从同分布。事实上,两组中的个体在协变量和潜在结果上的分布是相同的。因此,处理个体之间的平均结果是控制个体的平均结果的反事实。这两个平均值之间的差异是平均处理效应 ,这是不可观测到的个体层面的处理效果的中心趋势的估计。<ref>{{cite journal |last=Holland |first=Paul W. |year=1986 |title=Statistics and Causal Inference |journal=Journal of the American Statistical Association|volume=81 |issue=396 |pages=945–960 |jstor=2289064 }}</ref>如果样本是从总体中随机构成,那么'''<font color="#ff8000">样本平均处理效应 (Sample Average Treatment Effect, SATE)</font>'''也是'''<font color="#ff8000">总体平均处理效应 (Population Average Treatment Effect,PATE)</font>'''的估计值。<ref>{{cite journal |last=Imai |first=Kosuke |first2=Gary |last2=King |first3=Elizabeth A. |last3=Stuart |year=2008 |title=Misunderstandings Between Experimentalists and Observationalists About Causal Inference |journal=Journal of the Royal Statistical Society, Series |volume=171 |issue=2 |pages=481–502 |url=http://nrs.harvard.edu/urn-3:HUL.InstRepos:4142695 }}</ref> |
− | | |
| | | |
| 虽然实验确保了[[潜在结果]]以及所有协变量在处理组和对照组中的等价分布,但是在观察性研究中,情况并非如此。在观察性研究中,处理组和对照组个体并不服从随机分布,因此处理个体可能取决于未观测到或不可观测的因素。观察到的因素可以在统计学上加以控制 (如通过[[回归分析|回归]]或[[匹配]]) ,但是任何关于平均处理效应的估计都可能与不可观察因素混淆,这些因素影响了哪些个体接受了处理,哪些个体没有接受处理。 | | 虽然实验确保了[[潜在结果]]以及所有协变量在处理组和对照组中的等价分布,但是在观察性研究中,情况并非如此。在观察性研究中,处理组和对照组个体并不服从随机分布,因此处理个体可能取决于未观测到或不可观测的因素。观察到的因素可以在统计学上加以控制 (如通过[[回归分析|回归]]或[[匹配]]) ,但是任何关于平均处理效应的估计都可能与不可观察因素混淆,这些因素影响了哪些个体接受了处理,哪些个体没有接受处理。 |
第17行: |
第16行: |
| | | |
| 为了形式化定义平均处理效应,我们定义了两个潜在的结果: <math>y_{0}(i)</math > 是个体 <math> i </math> 没有被处理时的结果变量的取值,<math> y _ {1}(i) </math> 是个体 <math> i </math> 被处理时的结果变量的取值。例如,<math>y_{0}(i)</math > 是个体 <math> i </math> 没有被注射研究药物时的健康状态,<math>y_{1}(i)</math > 是个体 <math> i </math> 被注射药物时的健康状态。 | | 为了形式化定义平均处理效应,我们定义了两个潜在的结果: <math>y_{0}(i)</math > 是个体 <math> i </math> 没有被处理时的结果变量的取值,<math> y _ {1}(i) </math> 是个体 <math> i </math> 被处理时的结果变量的取值。例如,<math>y_{0}(i)</math > 是个体 <math> i </math> 没有被注射研究药物时的健康状态,<math>y_{1}(i)</math > 是个体 <math> i </math> 被注射药物时的健康状态。 |
− |
| |
| | | |
| 个体 <math> i </math> 的处理效应定义为 <math> y_{1}(i)-y_{0}(i) = \beta (i) </math> 。在一般情况下,这种处理效果在个体之间是不一样的。平均处理效果<math> \text{ATE} </math>的定义为 | | 个体 <math> i </math> 的处理效应定义为 <math> y_{1}(i)-y_{0}(i) = \beta (i) </math> 。在一般情况下,这种处理效果在个体之间是不一样的。平均处理效果<math> \text{ATE} </math>的定义为 |
第24行: |
第22行: |
| | | |
| 这里对总体中所有N数量个体的处理效应进行了聚合平均计算。 | | 这里对总体中所有N数量个体的处理效应进行了聚合平均计算。 |
− |
| |
| | | |
| 如果我们能观察到一个大型代表性样本中每个个体的<math> y _ {1}(i) </math> 和 <math> y _ {0}(i) </math> ,我们可以简单地通过取样本中 <math> y _ {1}(i)-y _ {0}(i) </math> 的平均值来估计平均处理效应。然而,我们不能同时观察每个个体的<math> y _ {1}(i)、y _ {0}(i) </math>,因为每个个体不能同时被处理和不被处理。例如,在药物例子中,我们只能观察到个体接受过药物治疗的<math> y _ {1}(i) </math> 和个体未接受药物的 <math> y _ {0}(i) </math> 。这是研究者们在评估治疗效果时面临的主要问题,并因此引发了大量与估计方法相关的研究。 | | 如果我们能观察到一个大型代表性样本中每个个体的<math> y _ {1}(i) </math> 和 <math> y _ {0}(i) </math> ,我们可以简单地通过取样本中 <math> y _ {1}(i)-y _ {0}(i) </math> 的平均值来估计平均处理效应。然而,我们不能同时观察每个个体的<math> y _ {1}(i)、y _ {0}(i) </math>,因为每个个体不能同时被处理和不被处理。例如,在药物例子中,我们只能观察到个体接受过药物治疗的<math> y _ {1}(i) </math> 和个体未接受药物的 <math> y _ {0}(i) </math> 。这是研究者们在评估治疗效果时面临的主要问题,并因此引发了大量与估计方法相关的研究。 |
第45行: |
第42行: |
| | | |
| 考虑一个失业群体,对其中一些个体给与政策干预(处理组),其余的不做任何处理(控制组)。现需要计算求职监控政策(干预)对失业期长短的影响: 平均来说,如果对个体进行求职监控(给与干预),失业期会缩短多少?在选择一种干预这种情况下,平均处理效应是处理组和对照组的失业时间长度的期望值(平均值)差异。 | | 考虑一个失业群体,对其中一些个体给与政策干预(处理组),其余的不做任何处理(控制组)。现需要计算求职监控政策(干预)对失业期长短的影响: 平均来说,如果对个体进行求职监控(给与干预),失业期会缩短多少?在选择一种干预这种情况下,平均处理效应是处理组和对照组的失业时间长度的期望值(平均值)差异。 |
| + | |
| | | |
| | | |
| 在这个例子中,平均处理效应为正值意味着就业政策延长了失业期,平均处理效应为负值表明就业政策缩短了失业期。平均处理效应等于零表明提供就业政策对失业期长短并没有任何利处或不利。判断一个平均处理效应估计值是否为可以区分的零值需要进行统计推断。 | | 在这个例子中,平均处理效应为正值意味着就业政策延长了失业期,平均处理效应为负值表明就业政策缩短了失业期。平均处理效应等于零表明提供就业政策对失业期长短并没有任何利处或不利。判断一个平均处理效应估计值是否为可以区分的零值需要进行统计推断。 |
| + | |
| | | |
| | | |
第57行: |
第56行: |
| | | |
| 一些研究人员将处理效果依赖于个体的情况称之为“异质性”。例如,上面提到的求职监控政策依赖于性别(男、女)或者是区域的不同。 | | 一些研究人员将处理效果依赖于个体的情况称之为“异质性”。例如,上面提到的求职监控政策依赖于性别(男、女)或者是区域的不同。 |
| + | |
| | | |
| | | |
| 一种异质处理效应的研究方法是将研究数据进行分组 (如按照男、女性别,或者区域进行划分) ,比较平均处理效果在子组内的效应差异。每个子组的平均处理效应被称为'''<font color="#ff8000">“条件平均处理效应”(Conditional Average Treatment Effect,CATE)</font>''' ,也就是说,每个子组的平均处理效应被称为条件平均处理效应,以子组内的分类方式为条件。 | | 一种异质处理效应的研究方法是将研究数据进行分组 (如按照男、女性别,或者区域进行划分) ,比较平均处理效果在子组内的效应差异。每个子组的平均处理效应被称为'''<font color="#ff8000">“条件平均处理效应”(Conditional Average Treatment Effect,CATE)</font>''' ,也就是说,每个子组的平均处理效应被称为条件平均处理效应,以子组内的分类方式为条件。 |
− |
| |
− |
| |
| | | |
| 这种研究方法存在的一个问题是,子组的数据可能比未分组的数据要少得多,没有足够数据进行分析。 | | 这种研究方法存在的一个问题是,子组的数据可能比未分组的数据要少得多,没有足够数据进行分析。 |
− |
| |
− |
| |
| | | |
| 也有一些利用随机森林检测异质处理效应的相关工作<ref name="het-paper">https://arxiv.org/abs/1510.04342</ref><ref name="het-blog-post">https://www.markhw.com/blog/causalforestintro</ref>。 | | 也有一些利用随机森林检测异质处理效应的相关工作<ref name="het-paper">https://arxiv.org/abs/1510.04342</ref><ref name="het-blog-post">https://www.markhw.com/blog/causalforestintro</ref>。 |
| | | |
− | == 参考文献 References ==
| + | == 扩展阅读 Further reading == |
− | | |
− | {{reflist}}
| |
− | | |
− | | |
− | | |
− | == 扩展阅读 Further reading == | |
| | | |
| *{{cite book |last=Wooldridge |first=Jeffrey M. |chapter=Policy Analysis with Pooled Cross Sections |pages=438–443 |title=Introductory Econometrics: A Modern Approach |year=2013 |publisher=Thomson South-Western |location=Mason, OH |isbn=978-1-111-53104-1 }} | | *{{cite book |last=Wooldridge |first=Jeffrey M. |chapter=Policy Analysis with Pooled Cross Sections |pages=438–443 |title=Introductory Econometrics: A Modern Approach |year=2013 |publisher=Thomson South-Western |location=Mason, OH |isbn=978-1-111-53104-1 }} |
第94行: |
第84行: |
| | | |
| ::这个视频内容来自[[集智俱乐部读书会]]-因果科学与Causal AI读书会第二季内容的分享,由英国剑桥大学及其学习组博士陆超超详细的阐述了潜在结果模型和结果因果模型,并介绍了两个框架的相互转化规律。 | | ::这个视频内容来自[[集智俱乐部读书会]]-因果科学与Causal AI读书会第二季内容的分享,由英国剑桥大学及其学习组博士陆超超详细的阐述了潜在结果模型和结果因果模型,并介绍了两个框架的相互转化规律。 |
− | ::1. 讲述因果推断的两大框架:潜在结果模型和结构因果模型,讨论他们各自的优缺点以及他们之间的联系,详细介绍他们之间的转化规律。 | + | ::1. 讲述因果推断的两大框架:潜在结果模型和结构因果模型,讨论他们各自的优缺点以及他们之间的联系,详细介绍他们之间的转化规律。 |
− | | |
− | | |
| *[https://www.bilibili.com/video/BV1NJ411w7ms?from=search&seid=15960075946481426104 Average Effect of Treatment on the Treated (ATT) 实验组的平均干预效应/匹配方法] | | *[https://www.bilibili.com/video/BV1NJ411w7ms?from=search&seid=15960075946481426104 Average Effect of Treatment on the Treated (ATT) 实验组的平均干预效应/匹配方法] |
− | ::B站搬运的杜克大学社会科学研究中心的分享视频,介绍了在使用匹配方法时会涉及到的ATT、CATE、ATE的方法。 | + | ::B站搬运的杜克大学社会科学研究中心的分享视频,介绍了在使用匹配方法时会涉及到的ATT、CATE、ATE的方法 |
− | | |
− | | |
− | | |
| === 文章总结 === | | === 文章总结 === |
| | | |
| | | |
− | * [https://mp.weixin.qq.com/s/f-rI5W6tc6qOzthbzK4oAw 崔鹏:稳定学习——挖掘因果推理和机器学习的共同基础] | + | *[https://mp.weixin.qq.com/s/f-rI5W6tc6qOzthbzK4oAw 崔鹏:稳定学习——挖掘因果推理和机器学习的共同基础] |
| | | |
| * 知乎上RandomWalk总结的关于因果推断之Potential Outcome Framework的内容,其中提到因果退镀and额目标就是从观测数据中估计treatment effect。 | | * 知乎上RandomWalk总结的关于因果推断之Potential Outcome Framework的内容,其中提到因果退镀and额目标就是从观测数据中估计treatment effect。 |
第115行: |
第100行: |
| | | |
| === 相关路径 === | | === 相关路径 === |
− | * [https://pattern.swarma.org/path?id=99 因果科学与Casual AI读书会必读参考文献列表],这个是根据读书会中解读的论文,做的一个分类和筛选,方便大家梳理整个框架和内容。 | + | *[https://pattern.swarma.org/path?id=99 因果科学与Casual AI读书会必读参考文献列表],这个是根据读书会中解读的论文,做的一个分类和筛选,方便大家梳理整个框架和内容。 |
− | * [https://pattern.swarma.org/path?id=9 因果推断方法概述],这个路径对因果在哲学方面的探讨,以及因果在机器学习方面应用的分析。 | + | *[https://pattern.swarma.org/path?id=9 因果推断方法概述],这个路径对因果在哲学方面的探讨,以及因果在机器学习方面应用的分析。 |
− | * [https://pattern.swarma.org/path?id=90 因果科学和 Causal AI入门路径],这条路径解释了因果科学是什么以及它的发展脉络。此路径将分为三个部分进行展开,第一部分是因果科学的基本定义及其哲学基础,第二部分是统计领域中的因果推断,第三个部分是机器学习中的因果(Causal AI)。 | + | *[https://pattern.swarma.org/path?id=90 因果科学和 Causal AI入门路径],这条路径解释了因果科学是什么以及它的发展脉络。此路径将分为三个部分进行展开,第一部分是因果科学的基本定义及其哲学基础,第二部分是统计领域中的因果推断,第三个部分是机器学习中的因果(Causal AI)。 |
− | | |
| | | |
| + | == 参考文献 References == |
| | | |
| + | {{reflist}} |
| | | |
| | | |