更改

跳到导航 跳到搜索
无编辑摘要
第3行: 第3行:  
如果协变量的个数很多,单个或多个协变量不平衡的现象就越有可能发生。即使增大样本量,单次试验的因果作用估计偏差问题也得不到解决。这是因为,虽然随着样本量n的增大,协变量以根号n的速度趋于平衡,但平均因果作用的估计量也以根号n的速度收敛,这导致协变量不平衡造成的偏差与因果作用的量级仍然处于同一尺度。
 
如果协变量的个数很多,单个或多个协变量不平衡的现象就越有可能发生。即使增大样本量,单次试验的因果作用估计偏差问题也得不到解决。这是因为,虽然随着样本量n的增大,协变量以根号n的速度趋于平衡,但平均因果作用的估计量也以根号n的速度收敛,这导致协变量不平衡造成的偏差与因果作用的量级仍然处于同一尺度。
   −
当面临不合适的随机分配时,Fisher曾建议进行再随机化。Morgan和Rubin首次对再随机化进行了正规的数学描述[11],其基本思路是:预先指定某种衡量协变量在不同处理组之间分布是否平衡的准则,不采纳那些协变量不平衡的随机分配,而是一直进行随机化,直到获得协变量平衡的随机分配为止。Morgan和Rubin建议使用处理组和对照组协变量均值的平方马氏距离作为准则,只接受平方马氏距离小于某个阈值的随机分配。他们还指出,通过再随机化,可以实现平均因果作用估计的方差下降。
+
当面临不合适的随机分配时,Fisher曾建议进行再随机化。Morgan和Rubin首次对再随机化进行了正规的数学描述,其基本思路是:预先指定某种衡量协变量在不同处理组之间分布是否平衡的准则,不采纳那些协变量不平衡的随机分配,而是一直进行随机化,直到获得协变量平衡的随机分配为止。Morgan和Rubin建议使用处理组和对照组协变量均值的平方马氏距离作为准则,只接受平方马氏距离小于某个阈值的随机分配。他们还指出,通过再随机化,可以实现平均因果作用估计的方差下降。
    
再随机化实验的统计推断比完全随机化实验的统计推断更加复杂。有一个处理组和一个对照组并使用平方马氏距离准则进行再随机化的情形下,Morgan和Rubin建议使用Fisher随机化检验进行统计推断。由于限制了处理组和对照组之间的协变量分布,所以处理组和对照组的平均结局差异并不再服从正态分布,而是服从一个正态分布和另一个截断正态分布的线性组合。近些年来,再随机化受到了越来越多的关注,例如协变量存在不同重要梯度时的再随机化、序贯实验中的再随机化。
 
再随机化实验的统计推断比完全随机化实验的统计推断更加复杂。有一个处理组和一个对照组并使用平方马氏距离准则进行再随机化的情形下,Morgan和Rubin建议使用Fisher随机化检验进行统计推断。由于限制了处理组和对照组之间的协变量分布,所以处理组和对照组的平均结局差异并不再服从正态分布,而是服从一个正态分布和另一个截断正态分布的线性组合。近些年来,再随机化受到了越来越多的关注,例如协变量存在不同重要梯度时的再随机化、序贯实验中的再随机化。

导航菜单