第10行: |
第10行: |
| 温尼伯大学最近的一项研究表明,青少年过度发短信与(知识)“肤浅”相关。有媒体证实说,发短信使得青少年更加肤浅(从干预角度说,对青少年进行干预,使他们减少发短信的数量,进而不让他们那么“肤浅”)。但是,这个实验没有证明任何事情,既可能是肤浅使青少年发短信更多,也可能是肤浅和短信过多是由一个共同因素引起的,例如基因。如果可能的话,对该基因因素进行干预,即可更好的确定是何种原因导致了该结果。 | | 温尼伯大学最近的一项研究表明,青少年过度发短信与(知识)“肤浅”相关。有媒体证实说,发短信使得青少年更加肤浅(从干预角度说,对青少年进行干预,使他们减少发短信的数量,进而不让他们那么“肤浅”)。但是,这个实验没有证明任何事情,既可能是肤浅使青少年发短信更多,也可能是肤浅和短信过多是由一个共同因素引起的,例如基因。如果可能的话,对该基因因素进行干预,即可更好的确定是何种原因导致了该结果。 |
| | | |
− | 由此,产生干预模型,通过do演算将因果关系从相关关系中分离出来。<!-- 写到这 | + | 由此,产生干预模型,通过do演算将因果关系从相关关系中分离出来。 |
− | --> | + | == 解决的问题<!-- 把牙膏例子补充完 --> == |
− | | |
− | == 解决的问题 ==
| |
| 干预是一种解决问题的方式,对于查询到的基于特定模型提出的问题。人们通常进行实验(干预)来回答。干预措施的形式是固定一个模型中一个变量的值,并观察结果。 | | 干预是一种解决问题的方式,对于查询到的基于特定模型提出的问题。人们通常进行实验(干预)来回答。干预措施的形式是固定一个模型中一个变量的值,并观察结果。 |
| | | |
第20行: |
第18行: |
| 实验操作者指出实验明确地调整了牙膏的价格。从图形上看,这阻止了任何原本会影响该变量的因果因素。从图表上看,这清除了所有指向实验变量的因果箭头。 | | 实验操作者指出实验明确地调整了牙膏的价格。从图形上看,这阻止了任何原本会影响该变量的因果因素。从图表上看,这清除了所有指向实验变量的因果箭头。 |
| | | |
− | 对于一个复杂的问题,可以进行更复杂的查询,其中将 do 运算符(值是固定的)应用于多个变量。 | + | 对于一个复杂的问题,可以进行更复杂的查询,其中将 do 运算符(值是固定的)应用于多个变量。<!-- 说明do运算符与干预的关系和联系 --> |
| | | |
− | == 数学演算 == | + | == 数学演算 ==<!-- 插入一段导言 说明 数学演算 中do算子和do演算与干预的联系 --> |
| | | |
| === '''''do''算子''' === | | === '''''do''算子''' === |
第34行: |
第32行: |
| do演算在进行转换时,利用一种规则集进行表示,这种规则集是完整的(可以用它来派生该系统中的每个真实表达式)。因此可以通过算法进一步确定,对于给定的模型,一个解是否在多项式时间内可计算。 | | do演算在进行转换时,利用一种规则集进行表示,这种规则集是完整的(可以用它来派生该系统中的每个真实表达式)。因此可以通过算法进一步确定,对于给定的模型,一个解是否在多项式时间内可计算。 |
| | | |
− | == ''do''演算规则 == | + | ====''do''演算规则 ==== |
− | | |
− | ==== Rules ====
| |
| 这个表达式包含了三个涉及 do 运算符的条件概率表达式转换规则。 | | 这个表达式包含了三个涉及 do 运算符的条件概率表达式转换规则。 |
| | | |
第82行: |
第78行: |
| 在这个例子中,X和Y之间没有因果路径相连接 | | 在这个例子中,X和Y之间没有因果路径相连接 |
| | | |
− | === 拓展 === | + | ===== 拓展 ===== |
− | 这些规则并不意味着可以删除任何查询的 do 运算符。在这些情况下,可以用一个受操纵的变量(例如饮食)来代替一个不受操纵的变量(例如血液胆固醇) ,然后这个变量可以被转化去除胆固醇。例子: | + | 这些规则并不意味着可以删除任何查询的 do 运算符。在这些情况下,可以用一个受操纵的变量(例如饮食)来代替一个不受操纵的变量(例如血液胆固醇) ,然后这个变量可以被转化去除胆固醇。例子:<!-- 说明具体的这个胆固醇的例子 --> |
| | | |
| [[文件:Image5.png]] | | [[文件:Image5.png]] |
第90行: |
第86行: |
| [[文件:因果模型.png|缩略图|342x342像素|图1 干预前|替代=|无]] | | [[文件:因果模型.png|缩略图|342x342像素|图1 干预前|替代=|无]] |
| | | |
− | [[文件:图1 干预模型.png|缩略图|344x344像素|图2 干预后|替代=|无]]以图1为例,如果我们要进行干预以降低冰激凌销量(比如,关闭所有冰激凌店),那么我们就去掉所有指向冰激凌销量 的边,并得到如图2所示的图模型。当我们在这个新的图模型中检验相关性时,我们发现犯罪率当然是与冰激凌销量完全独立的,因为冰激凌销量已经与天气温度无关了。换句话说,即使我们将 的值调整为另一个不变的值,这种变化也不会传递给可变的犯罪率 。我们看到,与以某个变量为条件不同,干预一个变量会导致一种完全不同的相关性关系,以某个变量为条件可以完全从数据中获得,但干预却会影响图模型结构的变化。 | + | [[文件:图1 干预模型.png|缩略图|344x344像素|图2 干预后|替代=|无]]以图1为例,如果我们要进行干预以降低冰激凌销量(比如,关闭所有冰激凌店),那么我们就去掉所有指向冰激凌销量 的边,并得到如图2所示的图模型。当我们在这个新的图模型中检验相关性时,我们发现犯罪率当然是与冰激凌销量完全独立的,因为冰激凌销量已经与天气温度无关了。换句话说,即使我们将 <!-- 补充 有缺失 -->的值调整为另一个不变的值,这种变化也不会传递给可变的犯罪率 。我们看到,与以某个变量为条件不同,干预一个变量会导致一种完全不同的相关性关系,以某个变量为条件可以完全从数据中获得,但干预却会影响图模型结构的变化。 |
| | | |
− | 在符号的表达上,我们使用do算子来表达这种干预。比如,当我们固定Y的值为y时,我们用do(Y=y)来表示这种干预行为。所以P(Z=z|Y=y)表示当以Y=y为条件时Z=z的概率,而P(Z=z|do(Y=y))表示当我们干预Y的值使其为y时,Z=z的概率。从概率分布的角度来说, 表示的是在Y可取的所有值中, Y=y那部分样本对应的Z=z的概率,而P(Z=z|do(Y=y)) 表示的是将每一个样本的Y的值全部固定为y后Z=z的概率。这两者是完全不同的,干预改变了原始数据的分布,而以变量为条件不改变原始数据的分布。
| + | 在符号的表达上,我们使用do算子来表达这种干预<!-- 将这种关系在前文也阐述一下 -->。比如,当我们固定Y的值为y时,我们用do(Y=y)来表示这种干预行为。所以P(Z=z|Y=y)表示当以Y=y为条件时Z=z的概率,而P(Z=z|do(Y=y))表示当我们干预Y的值使其为y时,Z=z的概率。从概率分布的角度来说, 表示的是在Y可取的所有值中, Y=y那部分样本对应的Z=z的概率,而P(Z=z|do(Y=y)) 表示的是将每一个样本的Y的值全部固定为y后Z=z的概率。这两者是完全不同的,干预改变了原始数据的分布,而以变量为条件不改变原始数据的分布。 |
| == 编者推荐 == | | == 编者推荐 == |
| | | |