更改

添加2,833字节 、 2022年6月5日 (日) 16:04
无编辑摘要
第1行: 第1行:  
此词条暂由因果科学读书会词条梳理志愿者我是猫(74989)翻译审校,未经专家审核,带来阅读不便,请见谅。
 
此词条暂由因果科学读书会词条梳理志愿者我是猫(74989)翻译审校,未经专家审核,带来阅读不便,请见谅。
 +
 +
== 来源 ==
 +
干预是因果关系之梯的第二层级,在因果之梯第一层,即便是“以某个变量为条件(conditioning on)”的操作,也只是依据现有观测到的数据进行统计,并没有改变数据的分布。
 +
 +
在实际应用中,干预也非常重要。比如,当我们对一种新的抗癌药物进行研究时,我们试图确定当我们对病人进行药物干预时,病人的病情如何变化。当我们研究暴力电视节目和儿童的攻击行为之间的关系时,我们希望知道,干预减少儿童接触暴力电视节目是否会减少他们的攻击性。
 +
 +
干预(intervention)和以变量为条件(conditioning on)有着本质的区别。当我们在模型中对一个变量进行干预时,我们将固定这个变量的值。其他变量的值也随之改变。当我们以一个变量为条件时,我们什么也不会改变;我们只是将关注的范围缩小到样本的子集,选取其中我们感兴趣的变量的值。因此,以变量为条件改变的是我们看世界的角度,而干预则改变了世界本身。
 +
 +
当我们进行干预以确定一个变量的值时,我们就限制了该变量随其他自然变量而变化的自然趋势。在图模型中,干预的操作将删除所有指向该变量的边。
    
== 查询 ==
 
== 查询 ==
第89行: 第98行:     
[[文件:Image5.png]]
 
[[文件:Image5.png]]
 +
 +
== 实例 ==
 +
以图1为例,如果我们要进行干预以降低冰激凌销量(比如,关闭所有冰激凌店),那么我们就去掉所有指向冰激凌销量  的边,并得到如图2所示的图模型。当我们在这个新的图模型中检验相关性时,我们发现犯罪率当然是与冰激凌销量完全独立的,因为冰激凌销量已经与天气温度无关了。换句话说,即使我们将  的值调整为另一个不变的值,这种变化也不会传递给可变的犯罪率  。我们看到,与以某个变量为条件不同,干预一个变量会导致一种完全不同的相关性关系,以某个变量为条件可以完全从数据中获得,但干预却会影响图模型结构的变化。
 +
 +
在符号的表达上,我们使用do算子来表达这种干预。比如,当我们固定Y的值为y时,我们用do(Y=y)来表示这种干预行为。所以P(Z=z|Y=y)表示当以Y=y为条件时Z=z的概率,而P(Z=z|do(Y=y))表示当我们干预Y的值使其为y时,Z=z的概率。从概率分布的角度来说, 表示的是在Y可取的所有值中, Y=y那部分样本对应的Z=z的概率,而P(Z=z|do(Y=y)) 表示的是将每一个样本的Y的值全部固定为y后Z=z的概率。这两者是完全不同的,干预改变了原始数据的分布,而以变量为条件不改变原始数据的分布。
 +
[[文件:因果模型.png|左|缩略图|342x342像素|图1 干预前]]
 +
[[文件:图1 干预模型.png|左|缩略图|344x344像素|图2 干预后]]
316

个编辑