“Donald Rubin”的版本间的差异
(→贡献和荣誉) |
|||
第51行: | 第51行: | ||
针对这种观察性研究,Rubin最初的想法是“匹配”,即将协变量X相同的个体放在一起比较,算出处理组和对照组之间的差异。但是这种方法的问题是,当X的维度很高时,基于原始协变量的匹配就越来越不现实。Rosenbaum和Rubin提出的倾向性评分,相当于对原始的协变量进行降维。倾向性评分 (propensity score,记作e(X)) 的定义是:e(X)=P(A=1|X)。它实际描述的是处理的分配机制。在Rosenbaum和Rubin的文章中,他们证明了A⊥{Y(0),Y(1)}|e(X),于是可以基于倾向性评分进行匹配。当然,在现实中,倾向性评分往往是未知的,需要进行估计。基于倾向性评分的因果效应的估计方法也有很多,除了匹配的估计,还有逆概率加权的估计,回归的估计等。本届诺奖得主Imbens在倾向性评分方法方面也做出了许多工作,如提出广义倾向评分等。 | 针对这种观察性研究,Rubin最初的想法是“匹配”,即将协变量X相同的个体放在一起比较,算出处理组和对照组之间的差异。但是这种方法的问题是,当X的维度很高时,基于原始协变量的匹配就越来越不现实。Rosenbaum和Rubin提出的倾向性评分,相当于对原始的协变量进行降维。倾向性评分 (propensity score,记作e(X)) 的定义是:e(X)=P(A=1|X)。它实际描述的是处理的分配机制。在Rosenbaum和Rubin的文章中,他们证明了A⊥{Y(0),Y(1)}|e(X),于是可以基于倾向性评分进行匹配。当然,在现实中,倾向性评分往往是未知的,需要进行估计。基于倾向性评分的因果效应的估计方法也有很多,除了匹配的估计,还有逆概率加权的估计,回归的估计等。本届诺奖得主Imbens在倾向性评分方法方面也做出了许多工作,如提出广义倾向评分等。 | ||
− | === | + | ===工具变量引入潜在结果框架=== |
此外,Rubin将工具变量引入了潜在结果的框架。为了确定因果效应,通常需要假设上述的可忽略性成立,这在观察性研究中很难满足,即存在某些观察不到的混杂变量,同时影响处理分配和结局。在有未观测混杂的情况下识别和估计因果作用一直是一个巨大的挑战。这个问题长期以来一直受经济学家的关注,他们长期以来在线性结构方程模型的框架下使用工具变量来处理“遗漏变量偏误”的问题,但是线性结构方程模型隐含了较强的同质性因果效应的假设。Angrist、Imbens、Rubin在1996年的《美国统计学会学刊(JASA)》上发表的文章首次将工具变量引入了因果推断的框架。这也是首次在潜在结果的框架中,提出工具变量的三条关键假设(排他性、相关性、独立性)。他们的文章还提出了依从者平均因果效应的概念,这个概念也为主分层概念的提出埋下了伏笔。 | 此外,Rubin将工具变量引入了潜在结果的框架。为了确定因果效应,通常需要假设上述的可忽略性成立,这在观察性研究中很难满足,即存在某些观察不到的混杂变量,同时影响处理分配和结局。在有未观测混杂的情况下识别和估计因果作用一直是一个巨大的挑战。这个问题长期以来一直受经济学家的关注,他们长期以来在线性结构方程模型的框架下使用工具变量来处理“遗漏变量偏误”的问题,但是线性结构方程模型隐含了较强的同质性因果效应的假设。Angrist、Imbens、Rubin在1996年的《美国统计学会学刊(JASA)》上发表的文章首次将工具变量引入了因果推断的框架。这也是首次在潜在结果的框架中,提出工具变量的三条关键假设(排他性、相关性、独立性)。他们的文章还提出了依从者平均因果效应的概念,这个概念也为主分层概念的提出埋下了伏笔。 | ||
2022年6月13日 (一) 20:56的版本
Donald Rubin是哈佛大学统计系[1]John L. Loeb讲座教授。他在缺失数据、因果推断、抽样调查、贝叶斯推断等统计学方法上作出了基础性贡献,其成果被广泛应用于心理学、教育学、政策、法律、经济学、流行病学、公共卫生以及其他社会和生物医学领域[2]。现任清华大学和天普大学讲席教授,美国科学院院士, 美国艺术与科学院院士, 美国科学促进会会士。Donald Rubin教授是当今世界影响力最深远的统计学家之一,他在现代统计领域做出了许多基础贡献,特别是在缺失数据和因果推断方面。他也是世界上被引用最多的科学作者之一,根据谷歌学者的数据,他被引用超过25万次。此外,截至2019年底,他有10篇单独发表的论文,每一篇都被引用超过1000次。
Donald Rubin教授的研究领域集中在:实验和观察研究中的因果推理;无响应抽样调查和缺失数据问题中的推理;贝叶斯技术的应用等。
他获得过统计学领域几乎所有著名奖项,是当今世界最具影响力的统计学家。他对科学的贡献已超出统计学范畴,其统计思想对生物医学、经济学、心理学、教育学、社会学及计算机科学等众多领域均产生了重要影响。
除了是统计学家,他还是一位音乐爱好者,音响发烧友,跑车迷。
研究兴趣[3]
- 实验和观察研究中的因果推理。
- 在无响应的样本调查和缺失数据问题中的推断。
- 贝叶斯和经验贝叶斯技术的应用。
- 开发统计模型并将其应用于各种科学学科的数据。
教育和工作经历
教育经历
- 1970: 统计学博士 - 哈佛大学
- 1966 年:计算机科学硕士 - 哈佛大学
- 1965 年:心理学学士学位 - 普林斯顿大学
工作经历
- 1984-2018:哈佛大学统计学系教授(退休)
- 1985 - 1994, 2000 - 2004: 哈佛大学统计系主任
- 1999 - 2001:马萨诸塞州剑桥市国家经济研究局理论和应用统计学研究员
- 1983 年至今:芝加哥大学研究助理
- 1982 - 1984:芝加哥大学统计系和教育系教授
生平
1943年12月22日,Donald Rubin出生于美国华盛顿特区,父母是Harriet和Allan[4]。一年后,全家迁居伊利诺伊州埃文斯顿市,他在那里长大。高中时他对物理和数学产生了浓厚的兴趣。1961年,Donald Rubin就读于普林斯顿大学,原计划主修物理,后转入心理学系,在1965年毕业。之后Don进入了哈佛大学心理学研究生院,1966年转读计算机系硕士,但最终于1970年获得统计学博士学位,师从Bill Cochran。毕业后,他在哈佛大学统计系教过一年书,1971年开始在美国教育考试服务中心(Educational Testing Service,ETS)工作,并成为普林斯顿大学新成立统计系的访问学者。接下来十年,他先后在哈佛大学、加州大学伯克利分校、得克萨斯大学奥斯汀分校、威斯康星麦迪逊大学做过访问学者。在1981-1983年,他是芝加哥大学的全职教授;1984年重返哈佛大学统计系并工作至今(译者注:Rubin已从哈佛退休,现任职于清华大学);1985-1994年,2000-2004年期间曾担任哈佛统计系主任。
贡献和荣誉
鲁宾因果框架
Rubin在他1974年的论文中将潜在结果的概念推广到了观察性数据中,真正开启了统计学界对因果推断的广泛研究。因此潜在结果框架有时也被称为鲁宾因果框架。
倾向性评分
Rubin的另一重大的贡献则是和Rosenbaum一起提出了倾向性评分的概念 。他们的这篇文章是著名统计学期刊Biometrika引用量最高的文章之一。
随机试验之所以被认为是因果推断的金标准,很大程度上是因为其处理是随机分配的,而不是由受试者自己选择的。处理是随机分配的假设可以形式化地表达为A⊥{Y(0),Y(1)}。在这条假设下,我们可以说明,基于观察数据得到的相关关系实际就反映了因果关系:
E[Y(1)-Y(0)] = E[Y(1)|A=1]-E[Y(0)|A=0] = E[Y|A=1]-E[Y|A=0]
其中,第二个等号成立是因为“一致性”,即在某种处理方案下观察到的结果就等于这种处理方案对应的潜在结果。
但是在现实中,处理是随机分配的假设往往不成立。例如在分层随机化实验中,我们先依据性别进行分组,进而在每个组内进行随机化实验,此时,条件在性别这个变量上(记作X)后,处理的分配是随机的,这个条件我们可以写成如下形式(即可忽略性):A⊥{Y(0),Y(1)}|X。很多观察性研究可以近似地看成是某种分层随机试验,尽管处理的分配不是随机的,但是当个体的某些特征都相同时(如性别、年龄、收入等),处理的分配可以看成是随机的。
针对这种观察性研究,Rubin最初的想法是“匹配”,即将协变量X相同的个体放在一起比较,算出处理组和对照组之间的差异。但是这种方法的问题是,当X的维度很高时,基于原始协变量的匹配就越来越不现实。Rosenbaum和Rubin提出的倾向性评分,相当于对原始的协变量进行降维。倾向性评分 (propensity score,记作e(X)) 的定义是:e(X)=P(A=1|X)。它实际描述的是处理的分配机制。在Rosenbaum和Rubin的文章中,他们证明了A⊥{Y(0),Y(1)}|e(X),于是可以基于倾向性评分进行匹配。当然,在现实中,倾向性评分往往是未知的,需要进行估计。基于倾向性评分的因果效应的估计方法也有很多,除了匹配的估计,还有逆概率加权的估计,回归的估计等。本届诺奖得主Imbens在倾向性评分方法方面也做出了许多工作,如提出广义倾向评分等。
工具变量引入潜在结果框架
此外,Rubin将工具变量引入了潜在结果的框架。为了确定因果效应,通常需要假设上述的可忽略性成立,这在观察性研究中很难满足,即存在某些观察不到的混杂变量,同时影响处理分配和结局。在有未观测混杂的情况下识别和估计因果作用一直是一个巨大的挑战。这个问题长期以来一直受经济学家的关注,他们长期以来在线性结构方程模型的框架下使用工具变量来处理“遗漏变量偏误”的问题,但是线性结构方程模型隐含了较强的同质性因果效应的假设。Angrist、Imbens、Rubin在1996年的《美国统计学会学刊(JASA)》上发表的文章首次将工具变量引入了因果推断的框架。这也是首次在潜在结果的框架中,提出工具变量的三条关键假设(排他性、相关性、独立性)。他们的文章还提出了依从者平均因果效应的概念,这个概念也为主分层概念的提出埋下了伏笔。
在Angrist、Imbens、Rubin的文章里,他们使用了一个非常巧妙的例子。这篇文章里他们分析了参军(veteran status in the Vietnam era,记作A)对健康结局(记作Y)的因果作用。在现实中,一个人是否参军往往受多种因素影响,一般很难穷尽所有影响参军和健康结局的共同因素。但是在这个研究中,有一个很巧妙的工具变量的设计,因为当时入伍的优先权是通过随机分配的通过抽签决定的(记作Z)。理论上说,抽中数字较小(Z=1)的人应该服役(A=1),抽中数字大(Z=0)的人不应该服役(A=1),但是在现实中,也会有不依从的现象出现。这里,Z就是一个较好的工具变量:首先,一个人抽中的数字的大小不会对健康有直接影响,只会通过影响服役(A)来影响健康,这满足排他性假设;其次,抽中数字的大小与潜在结果是无关的(因为抽签是随机分配的),这满足独立性假设;最后抽中数字小的人——尽管存在不依从的现象——参加兵役的可能性会更高,即相关性的假设成立。
但遗憾的是,即使上述三个条件均成立,工具变量依然不足以识别我们通常感兴趣的因果参数(如平均因果效应)。注意到人群中存在四种人,我们一一列出如下(此处A写成Z的潜在结果):
a) A(0)=0, A(1)=0。即无论抽签大小,均不服兵役。
b) A(0)=1, A(1)=1。即无论抽签大小,均服兵役。
c) A(1)=1, A(0)=0。即如果抽签抽中,(即抽签的数字小,Z=1)就去服兵役,反之不服兵役。
d) A(0)=1, A(1)=0。即如果抽签没抽中,(即抽签的数字小,Z=1)就去服兵役,反之不服兵役。
在Angrist、Imbens、Rubin的文章里,他们假设第四种人是不存在的,即“单调性”假设,也就是说,人群中没有这种看似非常奇怪的人,他们如果没被抽中就回去服兵役,但是被抽中的就不去服兵役。在这个例子中,单调性似乎是一个很有道理的假设。
在以上的假设下,Angrist、Imbens、Rubin提出了依从者(即第c类人)的平均因果效应是可以识别的,而且就等于如下的Wald估计量:
E[Y(1)-Y(0)|A(1)=1,A(0)=0] = {E[Y|Z=1]-E[Y|Z=0]}/{E[A|Z=1]-E[A|Z=0]}
这个量被称作局部平均因果作用(LATE),也被称作依从者平均因果作用(CACE)。
同一般的在计量中被广泛使用的“工具变量回归”,Angrist、Imbens、Rubin的方法几乎没有任何的模型假设。此后,对于处理未观测混杂的方法以及工具变量方法的研究变成了因果推断中的一个重要领域。
Donald Rubin指导或共同指导了超过50名博士生,撰写和编辑了12本著作,发表了近400篇文章。根据谷歌学术截至2014年5月的统计,Donald Rubin的学术成果已有15万次引用,单单2013年就有一万六千次引用,在全球学者中名列前茅。
由于他的诸多贡献,鲁宾被选为美国国家科学院院士,美国艺术与科学学院院士,英国国家学术院院士,美国统计学会会士,国际数理统计协会会士,国际统计学会会士,古根海姆基金会会士,洪堡基金会会士,伍德罗·威尔逊基金会会士。他获得了美国统计学会的 Samuel S. Wilks 奖、针对统计创新的 Parzen 奖,以及统计学会会长委员会的 Fisher 讲席奖和 George W. Snedecor奖。他被美国统计学会的波士顿和芝加哥分会誉为年度统计学家。此外,他还获得了德国的班贝格大学以及斯洛文尼亚的卢布尔雅那大学的荣誉学位。
Rubin的代表作
[1] DB Rubin.(2019) Essential concepts of causal inference: a remarkable history and an intriguing future.
这篇文章介绍了随机试验与观察研究中因果推断的基本概念及历史。Rubin在1975年,指出了因果推断的基本问题——缺失数据问题,并阐述了在观察研究中需要考虑设计阶段与处理分配机制。随后,在观察研究中因果推断得到迅速发展。
[2] AP Dempster, NM Laird, DB Rubin.(1977) Maximum Likelihood from Incomplete Data Via the EM Algorithm. Proceedings of the Royal Statistical Society, 39(1), 1-22.
这篇文章提出了一种从不完全数据中计算最大似然估计的广泛适用的算法。文中列举了许多例子,包括缺失值情况,对分组、删减或截断数据的应用,有限混合模型,方差分量估计,超参数估计,迭代重加权最小二乘和因子分析等。
[3] RJA Little, DB Rubin.(2019) Statistical analysis with missing data.
这本书回顾了处理丢失数据的历史方法,并描述了具有缺失值的多元分析的简单方法。作者根据数据统计模型和缺失数据机制衍生出的可能性为问题分析提供一个连贯的理论,并将该理论应用于广泛地重要缺失数据问题。
[4] PR Rosenbaum, DB Rubin.(1983) The central role of the propensity score in observational studies for causal effects. Biometrika, 70(1), 41-55.
在 Donald Rubin 早期因果推断的文献中,推崇的方法是“匹配”(matching)。如果观测协变量的维数较高,匹配就很难实现了。Paul Rosenbaum在哈佛统计系读PhD期间,在Rubin课上问到了这个问题,就促进了两人合作了这篇文章。这篇文章主要介绍了在观察性研究中,倾向评分的作用。我们应该根据倾向得分来“设计”观察性研究;按照倾向得分将人群进行匹配,形成一个近似的“随机化试验”。
[5] Rubin, D.B. (1978) Bayesian inference for causal effects: The role of randomization. The Annals of Statistics, 6, 34-58.
[6] Rubin, D. B. (1976) Inference and missing data. Biometrika, 63, 581-592.
编者推荐
集智俱乐部文章推荐
Donald Rubin亲自讲解什么是因果推断丨周五直播·因果科学读书会
Donald Rubin的因果推断学术贡献:超出统计学范畴的划时代影响
参考资料
- ↑ "Donald B. Rubin" (PDF). Harvard College. Retrieved September 18, 2019.
- ↑ https://mp.weixin.qq.com/s/OcKVr2AAZkJJ3-8qy_r-yA
- ↑ https://statistics.fas.harvard.edu/people/donald-b-rubin
- ↑ Li, Fan; Mealli, Fabrizia (2014). "A Conversation with Donald B. Rubin". Statistical Science. 29 (3): 439–457. arXiv:1404.1789. Bibcode:2014arXiv1404.1789L. doi:10.1214/14-STS489. S2CID 58334768.
- American statisticians
- Survey methodologists
- Harvard University faculty
- Temple University faculty
- Psychometricians
- Educational psychologists
- American psychologists
- Princeton University alumni
- 1943 births
- Living people
- Bayesian statisticians
- Fellows of the American Statistical Association
- Members of the United States National Academy of Sciences
- Harvard School of Engineering and Applied Sciences alumni
- Corresponding Fellows of the British Academy
- 待整理页面