因果效应度量

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
跳到导航 跳到搜索

因果效应(Causal Effect)是指当一个变量X发生变化时,它会导致另一个变量Y也发生变化。换句话说,就是量化X的变化对Y有多大的影响。它是一种客观的,建立在数学的基础之上的量化因果关系的指标。在当前的有关因果的数学定义中,基本上采取因果效应的说法来取代因果关系。

历史渊源

ohn Locke在他1690年发表的著作《人类理解论》中首次正式提出了因和果的概念:把产生观念的事物叫做原因,把所产生的东西叫做结果。在18世纪David Hume进一步发展了这个概念[1],提出因果不是事实之间的概念,而是经验之间的习惯性联想。他强调判断因果关系的三条准则:空间邻近性、时间连续性、恒常连结性。

19世纪末皮尔逊从高尔顿那里学会并发展了建立事物之间相关性的方法,通过一个特定的数值(皮尔逊相关系数)来简单直观地告诉人们两个事物(或变量)之间在变化趋势上的关联紧密程度,是朝着相同方向变化还是相反方向变化,以及这种变化的相关程度到底有多大。并认为相关性足以说明事物之间的联系,完全不需要在数学中定义因果关系,因果关系只是相关性一个特例。由皮尔逊的压制,因果以及因果关系的研究被沉淀了将近半个世纪。

现代因果关系研究的新曙光出现在20世纪20年代,其代表人物是美国科学家杰西·内曼(Jery Neyman),内曼研究了随机对照试验(RCT),并且指出从随机对照试验中发现因果关系的可能性和必要性,并提出了“潜在结果”的思想,潜在结果的思想是对于每个人或事物在面对不同情况(比如做与不做某件事、接受不同处理等)时都有相应的可能结果,但通常我们只能看到实际发生情况对应的那个结果,其他没发生情况对应的结果就是潜在的,我们可以通过一些方法来推断这些潜在结果以及不同情况带来的影响差异。由于研究结果是用波兰文发表的,所以当时并未引起关注。

克莱夫・格兰杰(Clive W.J. Granger)于 1969 年提出了一种用于分析基于时间序列的变量之间因果关系的方法,它的定义是在时间序列情形下,对于两个变量X、Y,若在包含了变量X、Y的过去信息的条件下,对变量Y的预测效果要优于只单独由Y的过去信息对Y进行的预测效果,即变量X的过去信息有助于解释变量Y的变化,则认为变量X是引致变量Y的格兰杰原因。

内曼关于“潜在结果”的思想,被唐纳德·鲁宾(DonaldRubin)于1974年独立地再次发现,并且加以丰富和提升,正式提出了因果效应的的概念,使之成为当前因果分析的重要模型之一,称为“鲁宾因果模型”或者“潜在结果模型”。

朱迪亚・珀尔(Judea Pearl)在 1995 年提出的结构因果模型(SCM)是一种以有向无环图和结构方程为基础,通过清晰描绘变量间因果结构、进行反事实推理和因果效应估计,来帮助人们理解和分析变量之间因果关系,广泛应用于多领域的因果分析工具。并在此基础上提出了因果分析框架,为因果分析提供了一套系统的、形式化的理论和方法体系,将因果关系划分为关联、干预、反事实三个层级,使得因果推理更加精确和实用[2]

进入21世纪初Giulio Tononi 和 Olaf Sporns 提出有效信息 (EI)的概念[3],它可以用来衡量一个马尔科夫动力学的因果效应强度。它通过干预实验来排除其他因素的影响,通过比较干预前后状态之间的互信息来量化因果效应。

前提假设

在现代的因果效应研究中,人们都是使用数学语言来描述因果效应,这样才能把对因果的研究建立在一个客观和科学的基础之上。数学的推理都是从公理或基本假设出发的,因此因果效应的度量也有着它的前提和基本假设。

变量处于同一个尺度

在不同的尺度上因果关系会表现为不同的形式。根据现在的主流观点,在量子层面上,因果关系就表现为很不一样的形态,甚至有人认为量子行为完全是随机的,而不是因果的。从如此小的尺度逐步演化为人类可以感知的宏观尺度,在这一过程中,人们所熟悉的因果关系出现了,这个现象称为“因果涌现”,至今仍然是科学之谜。自然界的现象很多,从量子到宇宙,具有不同量级的尺度。一般而言,因果关系是指同尺度现象之间的关系,很少有跨尺度的因果关系。例如对于疾病的研究般是从分子水平或者病菌水平考察与疾病的关系,尽管从根本上说疾病总是与物质的量子行为有关,但是因果关系不会从这个角度来研究,这种在同尺度下比较的相互关系奠定了因果关系的基石。

共因原理

共因原理(common causeprinciple,CCP):如果两个可观察对象X和Y在统计上是关联的,那么就存在一组变量Z(也可能是X或者Y),它会对这两个对象产生共同的影响,并解释所有的关联关系这一条也经常被解释为“每一个关联关系背后都有某种因果关系”。共因原理是一个重要的假设,虽然受到一些质疑,但是现在仍被众多理论所采纳。共因原理反映了因果关系的单向性,认为世界是沿着一个不可逆的方向在演化的。如“冰淇淋销量高-犯罪率高”的例子,在冰淇淋销量高和犯罪率高关联的背后,一定有第三个变量,即气温,使得在表观层面上两个毫无瓜葛的现象产生了强烈的关联,气温就是冰淇销量和犯罪率之间的共同原因。

独立因果机制

独立因果机制(independence causal mechanism,ICM):因果生成过程是由相互不影响的自治模块组成的,这表明每个因果关系之间是相对独立的。这一机制可以确保在研究中,只需要在相关的变量因果證步围内推斯因果关系,而无须担心其他因果关系的影响,这意味着因地关系具有稳健性、不变性和可重复性。例如在医学中,一项手术对了某个个体的治疗效果不会因为其他个体接受手术的情况而变化,一些细心的读者可能会想到,有些个体在看到别的手术出现不良效果时情绪产生波动、从而影响了自身的手术效果,在这种情况下,所考虑的原因变量要增加一个,即情绪。在新的变量环境下,手术的效果还是独立的(当然与不考虑情绪是有区别的)。不考虑病人的情绪,手术效果完全取决于手术本身。考虑病人的情绪,则手术效果取决于手术和情绪。在这两种情况下,系统都是独立的,不受外部影响。

因果关系和因果效应

因果关系是指一个事件(原因)与另一个事件(结果)之间存在的导致与被导致的关系,强调的是事件之间的逻辑联系和先后顺序,是一种定性的、结构性的关系描述。比如,“吸烟”与“肺癌”之间存在因果关系,即吸烟是导致肺癌的一个原因。 因果效应则侧重于描述原因对结果产生影响的具体程度或效果,是对因果关系在数量或程度上的量化表达,具有定量的性质。例如,研究发现长期大量吸烟的人患肺癌的风险比不吸烟的人高80%,这80%就是吸烟对患肺癌这一结果的因果效应的一种量化体现。因果效应能够为因果关系提供更具体、更精确的信息,帮助人们更深入地理解因果关系的本质和特征。通过因果效应的估计,可以明确原因变量对结果变量影响的具体程度和方式,使因果关系从定性的认知上升到定量的分析。

三种统计因果类型

考克斯与韦尔穆特依据既有因果度量的方法,提出统计因果性三个层级概念。

零级因果性

零级因果性聚焦统计的相关性,但强调原因先于结果且二者非独立条件,此相关性无法借由其他合理因素的调整而消除。如探究温室气体对地表升温的影响时,需考量太阳辐射等潜在因素,经此调整,方能判定温室气体对地球温度的作用。从数学视角,此为类似多元回归分析的依存关系,无法以其他解释变量阐释。在时间序列背景下,陆续被Granger(1969)、Schweder(1970)和Aalen(1987)正式化为格兰杰因果关系

一级因果性

在一级因果性观点中,目标是在不同干预下比较结果,给定系统中两个或更多可能的干预。例如,在两种医学干预D1和D0之间进行对比——一个是治疗药物,另一个是对照。将观察到D1使用的结果与在患者中使用D0时会观察到的结果进行对比(在其他条件相同的情况下)。如果证据显示使用D1而不是D0导致结果变化,那么可以说D1导致了这种变化。这种因果性推断的主要原则是在Rothamsted(Fisher, 1926, 1935; Yates, 1938, 1951)发展起来的。这种因果性的推断可能有决策制定的目标,也可能需要进行控制实验,尽管并非总是如此。例如,试图检查异常基因是否是特定疾病的成因时,干预是基因的正常和异常版本之间的假设(由于明确干预是不可能的),并且通常不涉及立即的决策过程。Rubin(1974)将因果性概念适应于使用类似Fisher表示法的观察性研究。上述第一层次观点中因果关系的定义是明确的比较性的,在科学研究中使用最广泛。

二级因果性

假设在科学背景下的初步分析已经建立了一种关联/依赖模式,或者提供了大量的一级或零级因果关系的证据。二级因果关系用于解释这些依赖关系是如何产生的,或者所观察到的因果关系涉及哪些潜在的生成过程。在某些情况下,这将需要结合该领域先前研究的信息或进行实验室实验。这方面的尝试始于Sewall Wright(Wright,19211934)对因果路径图的图形表示[13,14],后来由Cochran(1965)推广[15]。目前,非参数结构方程模型(NPSEMs)(Pearl,2000)[16]在该领域占据主导地位,它提供了一种适用于编码因果关系的非常通用的数据生成机制。

上述确定因果关系的每种类型都有其优缺点,其使用取决于研究的动机和性质。虽然主要涉及随机化实验的第一级因果估计可能会使研究结论更加安全,但无法揭示观察到的效应背后的生物、心理或物理过程。另一方面,零级因果关系受到批评,认为他们没有参与观察对系统做某事的因果效应。第二层次的因果关系需要实地知识,不能仅仅由数据驱动。

数据驱动的因果效应度量

格兰杰因果

转移熵

动态复杂性

收敛交叉映射

实验干预的因果效应度量

潜在结果模型

结构方程模型

因果分析框架

有效信息

知识建模的因果效应度量

  1. David Hume. An Enquiry concerning Human Understanding. 1748.
  2. Judea Pearl. Causality. Cambridge University Press, Cambridge, 2 edition, 2009.
  3. Giulio Tononi and Olaf Sporns. Measuring information integration. BMC Neuroscience, page 20, 2003.