因果度量
自然科学和社会科学的大部分研究都集中在确定过程或事件之间的因果关系上。也就是说,确定和度量因果关系是大多数自然现象科学研究的基础。自20世纪初以来,随着对因果关系的研究不断深入,已经开发了许多用于度量因果关系的方法,主要通过观察研究和实验干预两种手段来理解因果关系的性质。
统计因果性的三个层级
考克斯与韦尔穆特依据既有因果度量的方法,提出统计因果性三个层级概念。
零级因果性
零级因果性聚焦统计的相关性,但强调原因先于结果且二者非独立条件,此相关性无法借由其他合理因素的调整而消除。如探究温室气体对地表升温的影响时,需考量太阳辐射等潜在因素,经此调整,方能判定温室气体对地球温度的作用。从数学视角,此为类似多元回归分析的依存关系,无法以其他解释变量阐释。在时间序列背景下,陆续被Granger(1969)、Schweder(1970)和Aalen(1987)正式化为格兰杰因果关系。
一级因果性
在一级因果性观点中,目标是在不同干预下比较结果,给定系统中两个或更多可能的干预。例如,在两种医学干预D1和D0之间进行对比——一个是治疗药物,另一个是对照。将观察到D1使用的结果与在患者中使用D0时会观察到的结果进行对比(在其他条件相同的情况下)。如果证据显示使用D1而不是D0导致结果变化,那么可以说D1导致了这种变化。这种因果性推断的主要原则是在Rothamsted(Fisher, 1926, 1935; Yates, 1938, 1951)发展起来的。这种因果性的推断可能有决策制定的目标,也可能需要进行控制实验,尽管并非总是如此。例如,试图检查异常基因是否是特定疾病的成因时,干预是基因的正常和异常版本之间的假设(由于明确干预是不可能的),并且通常不涉及立即的决策过程。Rubin(1974)将因果性概念适应于使用类似Fisher表示法的观察性研究。上述第一层次观点中因果关系的定义是明确的比较性的,在科学研究中使用最广泛。
二级因果性
假设在科学背景下的初步分析已经建立了一种关联/依赖模式,或者提供了大量的一级或零级因果关系的证据。二级因果关系用于解释这些依赖关系是如何产生的,或者所观察到的因果关系涉及哪些潜在的生成过程。在某些情况下,这将需要结合该领域先前研究的信息或进行实验室实验。这方面的尝试始于Sewall Wright(Wright,19211934)对因果路径图的图形表示[13,14],后来由Cochran(1965)推广[15]。目前,非参数结构方程模型(NPSEMs)(Pearl,2000)[16]在该领域占据主导地位,它提供了一种适用于编码因果关系的非常通用的数据生成机制。
上述确定因果关系的每种类型都有其优缺点,其使用取决于研究的动机和性质。虽然主要涉及随机化实验的第一级因果估计可能会使研究结论更加安全,但无法揭示观察到的效应背后的生物、心理或物理过程。另一方面,零级因果关系受到批评,认为他们没有参与观察对系统做某事的因果效应。第二层次的因果关系需要实地知识,不能仅仅由数据驱动。
相关性与因果关系
因果关系的三层阶梯
数据驱动的因果测量方法
格兰杰因果关系(GC)
转移熵(TE)
收敛交叉映射(CCM)
压缩复杂性因果关系(CCC)