因果发现

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
Kunwuz讨论 | 贡献2022年6月26日 (日) 14:03的版本
跳到导航 跳到搜索

简介

因果发现,即从纯观测数据中发现并获取因果关系,在近几十年来作为基础的数据分析方法在各个学科发挥着重要的作用[1]


几乎所有的科学都是关于识别因果关系和支配它们的法律或规律性的。它们的规律。自十七世纪现代科学开始以来,有两种方法来发现因果关系:(1)操纵和改变系统中的某一些的特征,以观察其他特征是否发生变化;(2)观察系统特征的变化,而不进行操作。这两种方法都在十七世纪大放异彩,当时它们是互相交织在一起,就像今天一样。伊万杰里斯塔-托里切利操纵了站在一个装有水银的管子里的角度和形状,而管子中水银的高度没有变化。帕斯卡尔让人把托里切利设计的压力计抬到山上,以证明水银的高度确实随海拔高度而变化。伽利略曾从观测时间序列中确定了(定性的)木卫二卫星的轨道。开普勒从行星观测中得出了他的三大定律。牛顿则通过对太阳系的观察和一个单一的实验得出的引力定律奠定了现代物理学的基础。现代分子生物学是一个实验课题,但生物学的基础,在达尔文的《物种起源》中,只有一个实验,即种子的漂移。


发现因果关系的传统方法是使用干预措施或随机实验,这在很多情况下过于昂贵,过于耗时,甚至不可能。因此,通过分析纯粹的观察性数据来揭示因果信息,即所谓的因果发现,已经引起了人们的关注(Spirtes et al, 2000[2])。过去几十年 在过去的几十年中,我们看到了一系列跨学科的算法的进步 识别因果关系和效应大小的算法取得了一系列跨学科的进展。数据或混合实验和观察数据中识别因果关系和效应大小的算法取得了一系列跨学科的进展。这些发展有望使人们更好地利用适当的 "大数据"。它们已经被应用于基因组学、生态学、流行病学、空间物理学、临床医学、神经科学和许多其他领域,通常对其预测进行实验或准实验验证。在传统的因果关系研究中,当因果关系完全或部分已知时,用于识别因果效应或推断干预措施效果的算法,解决的是另一类问题。

基于约束的因果发现方法

基于评分的因果发现方法

基于约束性函数因果模型的因果发现方法

因果隐表征学习

因果发现工具:causal-learn

Causal-learn[3]是Tetrad[4] java代码的一个Python翻译和扩展。它提供了最新的因果发现方法的实现,以及简单而直观的API。

  1. Glymour, Clark, Kun Zhang, and Peter Spirtes. "Review of causal discovery methods based on graphical models." Frontiers in genetics 10 (2019): 524.
  2. Spirtes, Peter, et al. Causation, prediction, and search. MIT press, 2000.
  3. https://causal-learn.readthedocs.io/en/latest/
  4. https://github.com/cmu-phil/tetrad