更改

添加867字节 、 2022年6月12日 (日) 10:11
无编辑摘要
第12行: 第12行:  
由此,产生干预模型,通过do演算将因果关系从相关关系中分离出来。
 
由此,产生干预模型,通过do演算将因果关系从相关关系中分离出来。
 
== 解决的问题<!-- 把牙膏例子补充完  --> ==
 
== 解决的问题<!-- 把牙膏例子补充完  --> ==
干预是一种解决问题的方式,对于查询到的基于特定模型提出的问题。人们通常进行实验(干预)来回答。干预措施的形式是固定一个模型中一个变量的值,并观察结果。
+
干预是一种解决问题的方式,对于查询到的基于特定模型提出的问题。人们通常进行实验(干预)来回答。干预措施的形式是固定一个模型中一个变量的值,并观察结果。例如:如果我们将牙膏的价格提高一倍,那么人们购买牙线的概率将是多少?因果无法通过检验历史信息来确定,因为可能存在其他因素同时影响这两个变量,比如存在牙膏价格变化的其他原因,而且这种原因会影响牙线的价格(例如两种商品的关税增加)。
   −
在数学上,这样的查询采取的形式(来自示例)[[文件:Q.png]]
+
数学上用[[文件:Q.png]]来表示这种概率,表示这种概率。其中do是一个算子,表示对谁做实验性干预(如价格翻倍)。从图形上看,这阻止了任何原本会影响该变量的因果因素。从图表上看,这清除了所有指向实验变量的因果箭头。对于一个复杂的问题,可以进行更复杂的查询,其中将 do 运算符(值是固定的)应用于多个变量。<!-- 说明do运算符与干预的关系和联系 -->
 
  −
实验操作者指出实验明确地调整了牙膏的价格。从图形上看,这阻止了任何原本会影响该变量的因果因素。从图表上看,这清除了所有指向实验变量的因果箭头。
  −
 
  −
对于一个复杂的问题,可以进行更复杂的查询,其中将 do 运算符(值是固定的)应用于多个变量。<!-- 说明do运算符与干预的关系和联系 -->
      
== 数学演算 ==<!-- 插入一段导言  说明 数学演算 中do算子和do演算与干预的联系 -->
 
== 数学演算 ==<!-- 插入一段导言  说明 数学演算 中do算子和do演算与干预的联系 -->
 +
在数学上,我们是通过do运算符也就是do算子表示对一个变量的干预,在计算干预的因果效应时,我们需要将含有do运算符的表达式,转化为可以计算的一般的概率表达式的过程称为do演算。
    
=== '''''do''算子''' ===
 
=== '''''do''算子''' ===
第79行: 第76行:     
===== 拓展 =====
 
===== 拓展 =====
这些规则并不意味着可以删除任何查询的 do 运算符。在这些情况下,可以用一个受操纵的变量(例如饮食)来代替一个不受操纵的变量(例如血液胆固醇) ,然后这个变量可以被转化去除胆固醇。例子:<!-- 说明具体的这个胆固醇的例子 -->
+
这些规则并不意味着任何查询可以移除 do算子。有些情况下,将一个不能进行的操作换成另一个可以进行的操作也是有意义的。例如,我们在研究血胆固醇对心脏病地影响,由于血胆固醇含量是无法直接固定地,但是我们可以通过固定饮食摄入量来同等表示,这就是用一个受操纵的变量(例如饮食)来代替一个不受操纵的变量(例如血液胆固醇) ,然后这个变量可以被转化去除胆固醇。<!-- 说明具体的这个胆固醇的例子 -->
    
[[文件:Image5.png]]
 
[[文件:Image5.png]]
第86行: 第83行:  
[[文件:因果模型.png|缩略图|342x342像素|图1 干预前|替代=|无]]
 
[[文件:因果模型.png|缩略图|342x342像素|图1 干预前|替代=|无]]
   −
[[文件:图1 干预模型.png|缩略图|344x344像素|图2 干预后|替代=|无]]以图1为例,如果我们要进行干预以降低冰激凌销量(比如,关闭所有冰激凌店),那么我们就去掉所有指向冰激凌销量  的边,并得到如图2所示的图模型。当我们在这个新的图模型中检验相关性时,我们发现犯罪率当然是与冰激凌销量完全独立的,因为冰激凌销量已经与天气温度无关了。换句话说,即使我们将  <!-- 补充 有缺失 -->的值调整为另一个不变的值,这种变化也不会传递给可变的犯罪率  。我们看到,与以某个变量为条件不同,干预一个变量会导致一种完全不同的相关性关系,以某个变量为条件可以完全从数据中获得,但干预却会影响图模型结构的变化。
+
[[文件:图1 干预模型.png|缩略图|344x344像素|图2 干预后|替代=|无]]以图1为例,如果我们要进行干预以降低冰激凌销量(比如,关闭所有冰激凌店),那么我们就去掉所有指向冰激凌销量  的边,并得到如图2所示的图模型。当我们在这个新的图模型中检验相关性时,我们发现犯罪率当然是与冰激凌销量完全独立的,因为冰激凌销量已经与天气温度无关了。换句话说,即使我们将冰淇淋销售量  <!-- 补充 有缺失 -->的值调整为另一个不变的值,这种变化也不会传递给可变的犯罪率  。我们看到,与以某个变量为条件不同,干预一个变量会导致一种完全不同的相关性关系,以某个变量为条件可以完全从数据中获得,但干预却会影响图模型结构的变化。
    
在符号的表达上,我们使用do算子来表达这种干预<!-- 将这种关系在前文也阐述一下 -->。比如,当我们固定Y的值为y时,我们用do(Y=y)来表示这种干预行为。所以P(Z=z|Y=y)表示当以Y=y为条件时Z=z的概率,而P(Z=z|do(Y=y))表示当我们干预Y的值使其为y时,Z=z的概率。从概率分布的角度来说, 表示的是在Y可取的所有值中, Y=y那部分样本对应的Z=z的概率,而P(Z=z|do(Y=y)) 表示的是将每一个样本的Y的值全部固定为y后Z=z的概率。这两者是完全不同的,干预改变了原始数据的分布,而以变量为条件不改变原始数据的分布。
 
在符号的表达上,我们使用do算子来表达这种干预<!-- 将这种关系在前文也阐述一下 -->。比如,当我们固定Y的值为y时,我们用do(Y=y)来表示这种干预行为。所以P(Z=z|Y=y)表示当以Y=y为条件时Z=z的概率,而P(Z=z|do(Y=y))表示当我们干预Y的值使其为y时,Z=z的概率。从概率分布的角度来说, 表示的是在Y可取的所有值中, Y=y那部分样本对应的Z=z的概率,而P(Z=z|do(Y=y)) 表示的是将每一个样本的Y的值全部固定为y后Z=z的概率。这两者是完全不同的,干预改变了原始数据的分布,而以变量为条件不改变原始数据的分布。
316

个编辑