更改

结构因果模型 (查看源代码)

2021年5月28日 (五) 15:02的版本

添加14,632字节、 2021年5月28日 (五) 15:02

无编辑摘要

第161行：第161行：

由于基因在人群中随机变化，因此基因的存在通常可以视为工具变量，这意味着在许多情况下，可以使用观察性研究中的回归来量化因果关系。

−

~~Category~~:~~Causal diagrams~~

+

== 关联 ==

+

=== 独立条件 ===

+

独立条件是用于确定两个变量是否彼此独立的规则。如果一个变量的值不直接影响另一个变量的值，则两个变量是独立的。多个因果模型可以共享独立条件。例如，模型

+

:<math> A -> B -> C</math>

+

和

+

:<math> A <- B -> C</math>

+

具有相同的独立条件，因为B作为条件时A和C独立。但是，这两个模型的含义不同，还可能与数据不符（也就是说，如果观测数据显示在B作为条件后显示了A和C之间的关联，那么这两个模型都是不正确的）。相反，数据无法显示这两个模型中的哪个是正确的，因为它们具有相同的独立性条件。

+

将变量作为条件是进行假设实验的一种机制。将变量作为条件即在条件变量的给定值下分析其他变量的值。在第一个示例中，B作为条件意味着对B的给定值的观察不应显示出A和C之间的依赖关系。如果存在这种依赖关系，则该模型是不正确的。非因果模型无法进行这种区分，因为它们不会做出因果断言。

+

=== 混杂/去混杂 ===

+

设计相关性研究的基本要素是确定对所研究变量（如人口统计学）的潜在混杂影响。控制这些变量是为了消除这些影响。但是，不能先验地确定混杂变量的正确列表。因此，一项研究可能会控制不相关的变量，甚至（间接地）控制所研究的变量。

+

因果模型为识别恰当的混杂变量提供了一种鲁棒的技术。形式地，如果“Y通过不经过X的路径与Z关联”，则Z是混杂因素。这些通常可以使用为其他研究所收集的数据来确定。数学上，如果

+

:<math> P(Y|X) != P(Y|do(X))</math>

+

那么X是Y的混杂因子。

+

在此之前，混杂因子的不正确的定义包括：

+

“与X和Y都相关的任何变量。”

+

Y is associated with Z among the unexposed.

+

Noncollapsibility: A difference between the "crude relative risk and the relative risk resulting after adjustment for the potential confounder".

+

流行病学：在大范围总体中与X相关的变量，而在未接触X的人群中与Y相关的变量。

+

在如下模型中，上述定义是有缺陷的：

+

:<math> X \rightarrow Z \rightarrow Y</math>

+

Z符合定义，但Z是中介因子，而不是混杂因子，并且是控制结果的一个例子。

+

在模型中

+

:<math> X \leftarrow A \rightarrow B \leftarrow C \rightarrow Y</math>

+

传统上，B被认为是混杂因子，因为它与X和Y关联，但B既不在因果路径上，也不是因果路径上任何节点的后代。控制B将使B成为混杂因子。这被称为M偏差。

+

=== 后门调整 ===

+

为了分析因果模型中X对Y的因果效应，我们需要针对所有混杂变量进行调整（去混杂）。为了确定混杂变量的集合，我们需要（1）通过该集合阻塞X和Y之间的每个非因果路径（2）不破坏任何因果路径，以及（3）不创建任何虚假路径。

−

~~类别: 因果图表~~

+

定义：从X到Y的后门路径是指从从X到Y的任何以指向X的箭头开始的路径。

+

定义：给定模型中的一对有序变量（X，Y），如果（1）混杂变量集Z中没有X的后代，（2）X和Y之间的所有后门路径都被Z中的混杂变量阻断，则称混杂变量集Z满足后门准则。

+

如果满足（X，Y）的后门准则，则在控制混杂变量集Z时X和Y是无混杂的。除了混杂变量外，没有必要控制其他任何变量。后门准则是找到混杂变量Z的集合的充分条件，但不是必要条件，从而无法分析X对Y的因果效应。

−

~~Category~~:~~Causality~~

+

当因果模型是现实的合理表示并且满足后门准则时，则可以将局部回归系数用作（因果）路径系数（对于线性关系）。

+

{\ displaystyle P（Y | do（X））= \ textstyle \ sum _ {z} \ displaystyle P（Y | X，Z = z）P（Z = z）}{\ displaystyle P（Y | do（X））= \ textstyle \ sum _ {z} \ displaystyle P（Y | X，Z = z）P（Z = z）}

+

=== 前门调整 ===

+

如果阻塞路径的所有元素都不可观测，则后门路径不可计算，但是如果所有从X到Y的路径都有元素z，并且z到Y没有开放的路径，那么我们可以使用z的集合Z来测量:<math> P(Y|do(X))</math>。 Effectively, there are conditions where Z can act as a proxy for X.

−

~~分类: 因果关系~~

+

定义：前门路径是这样的直接因果路径，（1）Z阻断了所有X到Y的有向路径（2）X到Y没有后门路径（3）所有Z到Y的后门路径都被X阻断。

+

以下式子通过将前门路径上的变量集Z作条件，将含有do的表达式转化成不含do的表达式：

−

~~Category:Formal epistemology~~

+

{\ displaystyle P（Y | do（X））= \ textstyle \ sum _ {z} \ left [\ displaystyle P（Z = z | X）\ textstyle \ sum _ {x} \ displaystyle P（Y | X = x，Z = z）P（X = x）\ right]}{\ displaystyle P（Y | do（X））= \ textstyle \ sum _ {z} \ left [\ displaystyle P（Z = z | X）\ textstyle \ sum _ {x} \ displaystyle P（Y | X = x，Z = z）P（X = x）\ right]}

−

范畴: ~~形式认识论~~

+

假定上述概率涉及到的观察数据可用，则无需进行实验即可计算出最终概率，而不管是否存在其他混杂路径且无需进行后门调整。

+

==干预==

+

===查询===

+

查询是根据特定模型提出的问题。通常通过进行实验（干预）来回答这些问题。干预采取固定模型中一个变量的值并观察结果的形式。从数学上讲，此类查询采用以下形式（例子）：

+

:<math> P(牙线|do(牙膏))</math>

+

其中do算子表示该实验明确修改牙膏的价格。图形上看，这可以阻止任何可能影响该变量的因果因子。在图解中，这消除了所有指向实验变量（牙膏价格）的因果箭头。

+

do算子应用于多个变量（使其取值固定）的更复杂的查询也是可能的。

+

===do运算===

+

do运算是一组可用于将一个表达式转换为另一个表达式的一系列操作，其总体目标是将包含do算子的表达式转换为不包含do算子的表达式。不含do算子的表达式可以仅从观察数据中估计出来，而无需进行实验干预，而实验干预可能是代价大，耗时长的甚至是不道德的（例如，要求受试者吸烟）。do运算的规则集是完备的（可用于推导出该系统中的每个真命题）。有一种算法可以确定对于给定模型，解是否可以在多项式时间内计算。

+

====规则集====

+

该运算包括了三条涉及do算子的条件概率变形规则。

+

=====规则1=====

+

规则1用来增删观测：

+

:<math> P(Y|do(X),Z,W)=P(Y|do(X),Z)</math>

+

在删除所有指向X的箭头的图中，Z阻塞了所有从W到Y的路径。

+

=====规则2=====

+

规则2用来把干预替换成观测或者反过来：

+

:<math> P(Y|do(X),Z)=P(Y|X,Z)</math>

+

在原图中Z满足后门准则。

+

=====规则3=====

+

规则3用来增删干预：

+

:<math> P(Y|do(X))=P(Y)</math>

+

在原图中X和Y间没有因果路径。

+

=====扩展=====

+

这些规则并不意味着任何查询都能移除do算子。有些情况下，讲一个不能进行的操作换成另一个可以进行的操作也是有意义的。例子：

+

:<math> P(心脏病|do(血胆固醇))=P(心脏病|do(饮食))</math>

+

==反事实==

+

反事实考虑那些无法从数据中得到的概率，如一个不吸烟的人在过去重度吸烟的话，他现在会不会得癌症。

+

===潜在结果===

+

定义：Y的潜在结果是“如果X被赋值为x，对于个体u来说Y会怎么样”.数学上表达：

+

:<math> Y_X=x(u)或Y_x(u)</math>

+

潜在结果是在个体u的层次定义的。

+

传统的潜在结果是数据驱动的，而非模型驱动的，这限制了他辨析因果关系的能力。它将因果问题当作数据缺失问题，甚至在标准场景下都会给出错误的回答。

+

===因果推断===

+

在因果模型的语境中，潜在结果是被从因果角度解释的，而非从统计角度解释。

+

因果推断的第一定律意味着潜在结果

+

:<math> Y_x(u)</math>

+

可以被这样计算，将因果模型M中指向X的箭头删除，计算特定的x的结果。形式上，

+

:<math> Y_x(u)=Y_M_x(u)</math>

+

===执行反事实===

+

用一个因果模型计算反事实包括三步。这种方法不管模型是线性还是非线性都有效。当因果关系确定时，可以计算出一个点估计。在其他情况下（如仅能计算概率时），可以计算出一个概率区间，如原本不吸烟的人如果吸烟会增加10-20%的癌症概率。

+

在这个模型中，

+

:<math> Y<-X->M->Y<-U</math>

+

the equations for calculating the values of A and C derived from regression analysis or another technique can be applied, substituting known values from an observation and fixing the value of other variables (the counterfactual)

+

====Abduct====

+

应用归纳推理（使用观察来找到最简单/最可能的解释的逻辑推理）来估计u，它是支持反事实的特定观察上未观察到的变量的代理。根据命题证据计算u的概率。

+

====Act====

+

对于特定观察，使用do算子建立反事实（如令m = 0），从而相应地修改方程式。

+

====Predict====

+

使用修改后的公式计算输出（y）的值。

+

===中介===

+

直接原因和间接原因（中介）可以通过执行反事实区分。理解中介需要在干预直接原因时保持中介恒定。在模型

+

:<math> Y<-M<-X->Y</math>

+

中，M是X对Y影响的中介，X对Y也有非中介影响。这样保持M恒定，就可以计算do(X)。

+

The Mediation Fallacy instead involves conditioning on the mediator if the mediator and the outcome are confounded, as they are in the above model.

+

对于线性模型，可以通过取中介路径上所有路径系数的乘积来计算间接效应。总间接效应是通过各个间接效应的和计算得出的。对于线性模型，当拟合的不包括中介的方程式的系数与包含中介的方程式的系数显着不同时， For linear models mediation is indicated when the coefficients of an equation fitted without including the mediator vary significantly from an equation that includes it

+

===直接效应===

+

在这样模型的实验中，受控直接效应（CDE）通过将M强行赋值（do(M=0)）和随机化（do(X=0),do(X=1),...），然后观察Y的结果值获得。

+

{\displaystyle CDE(0)=P(Y=1|do(X=1),do(M=0))-P(Y=1|do(X=0),do(M=0))}

+

每个中介因子有一个相应的CDE。

+

然而，更好的实验时计算自然直接效应（NDE）。 This is the effect determined by leaving the relationship between X and M untouched while intervening on the relationship between X and Y。

+

{\displaystyle NDE=P(Y_{M=M0}=1|do(X=1))-P(Y_{M=M0}=1|do(X=0))}

+

例如，考虑每年或几年去看牙科医生的次数（X）的直接效应，去看牙科医生会使牙科医生鼓励人们使用牙线（M）。牙龈（Y）因此变得更健康，这归因于牙科医生（直接）或牙线（中介/间接）。需要进行的实验是继续使用牙线，但不去看牙科医生。

+

===间接效应===

+

X对Y的间接效应是increase we would see in Y while holding X constant and increasing M to whatever value M would attain under a unit increase in X 。

+

间接效应不能被控制，因为不能通过保持另一个变量恒定来禁用直接路径。自然间接效应（NIE）是使用牙线（M）对牙龈健康（Y）的影响。NIE的计算方式为（使用无牙线和无牙线的情况）给定牙医和没有牙医的情况下使用牙线的概率微分的和，或

+

{\displaystyle NIE=\sum _{m}[P(M=m|X=1)-P(M=m|X=0)]xxP(Y=1|X=0,M=m)}

+

NDE计算包括了反事实步骤({\displaystyle Y_{M=M0}})。对于非线性模型，下列看上去显然的等式

+

:<math> Total effect=Direct+Indirect effect</math>

+

是不成立的，因为 anomalies such as threshold effects and binary values。然而，

+

{\displaystyle {\mathsf {Total\ effect}}(X=0\rightarrow X=1)=NDE(X=0\rightarrow X=1)-\ NIE(X=1\rightarrow X=0)}

+

对于所有线性和非线性模型都是可以生效的。它允许NDE直接从观测的数据计算出了，不需要干预或使用反事实下标。

+

==可移植性==

+

即使因果模型（和相关数据）不同，因果模型也提供了一种工具来集成跨数据集的数据，称为移植。例如，调查数据可以与随机对照试验数据合并。移植提供了一个外部有效性问题的解决方案，即一项研究是否可以在不同的背景下应用。

+

一，如果两个模型在所有相关变量上都匹配并且已知来自其中一个模型的数据是无偏的，则可以使用一个总体的数据得出关于另一个总体的结论（迁移）。二，已知数据存在偏差，则重加权可以允许模型在数据集间移植。三，可以从不完整的数据集中得出结论。四，可以组合（移植）来自多个总体的研究数据，以得出有关未观测总体的结论。五，结合多个研究的估计值（例如P（W | X））可以提高结论的准确性。

+

Do演算为移植提供了一个通用标准：目标变量可以通过一系列不涉及任何“差异”变量（能够区分两个总体的变量）的do运算转换为另一个表达式。有一个类似的规则适用于参与者相对不同的研究。

+

==贝叶斯网络==

+

因果模型可以用贝叶斯网实现。贝叶斯网络可用于提供事件的逆概率（给定结果，具体原因的概率是多少）。这就需要准备一个条件概率表，显示所有可能的输入和结果以及相关的概率。

+

例如，给定疾病和针对疾病的检验的两变量模型，条件概率表的形式为：

+

Test

+

Disease Positive Negative

+

Negative 12 88

+

Positive 73 27

+

根据该表，当患者没有疾病时，阳性测试的可能性为12％。

+

尽管这对于小问题很容易解决，但是随着变量数量及其相关状态的增加，概率表（以及相关的计算时间）呈指数增长。

+

贝叶斯网络在商业上可用于如无线数据纠错和DNA分析之类的应用中。

+

==不变量/语境==

+

因果的不同概念涉及不变关系的概念。在识别手写数字的情况下，数字形状决定含义，因此形状和含义是不变量，更改形状会更改含义。其他属性则没有此性质（如颜色）。此不变性在各种非不变量所构成语境中生成的数据集都应满足。与其使用汇总的数据集进行学习评估因果关系，不如对一个数据集进行学习并对另一数据集进行测试可以帮助将变化属性与不变量区分开。

+

Category:Causal diagrams

+

类别: 因果图表

+

Category:Causality

+

分类: 因果关系

+

Category:Formal epistemology

+

范畴: 形式认识论

Category:Scientific modeling

−

类别: 科学建模

Sikongpop

134

个编辑

更改

结构因果模型 (查看源代码)

2021年5月28日 (五) 15:02的版本

导航菜单

搜索