更改

跳到导航 跳到搜索
添加1,601字节 、 2022年6月5日 (日) 19:13
无编辑摘要
第80行: 第80行:  
:1、当忽略隐藏变量时,组的大小是非常不同的。医生倾向于对严重的病例(大结石)给予较好的治疗(A) ,对较轻的病例(小结石)给予较差的治疗(B)。因此,总数由第三组和第二组支配,而不是由规模小得多的第一组和第四组支配。
 
:1、当忽略隐藏变量时,组的大小是非常不同的。医生倾向于对严重的病例(大结石)给予较好的治疗(A) ,对较轻的病例(小结石)给予较差的治疗(B)。因此,总数由第三组和第二组支配,而不是由规模小得多的第一组和第四组支配。
    +
:2、潜伏变量对比率有很大的影响,也就是说成功率更多地受到病情严重程度的影响,而不是治疗方法的选择。因此,治疗 A组(第三组)大结石患者的情况比治疗小结石患者差,即使后者采用劣等治疗 B 组(第二组)。
 +
 +
== 避免辛普森悖论 ==
 +
 +
=== 混杂变量 ===
 +
在上述的事例中,出现辛普森悖论的很大一个原因是由于存在隐藏变量,因此这便提醒我们,在进行变量设计时,一是要尽量多查阅文献以了解自变量,因变量及其他重要变量之间的关系,二是需要相关的经验,能够敏锐的察觉到某个变量的重要性。
   −
:2、潜伏变量对比率有很大的影响,也就是说成功率更多地受到病情严重程度的影响,而不是治疗方法的选择。因此,治疗 A组(第三组)大结石患者的情况比治疗小结石患者差,即使后者采用劣等治疗 B 组(第二组)。
+
这个重要潜伏变量指的是与实验分析的因果都有关系的变量,这一变量的缺失可能会掩盖或颠倒研究变量的原有关系。
 +
 
 +
比如在录取率这个例子中,专业既与录取率有关,不同专业难度不同,录取率自然有差异,又与性别有关,女生和男生趋向报考的专业不同。因此专业就是一个重要潜伏变量。
 +
 
 +
=== 样本选择偏差 ===
 +
某些研究在变量设计上用心良苦,但却忽略了抽取样本的代表性。关于抽烟和肺癌两者相关性的研究想必大家都有所耳闻,有些实验在进行简单二元分析后得出抽烟和患肺癌没有相关性,从而得出抽烟对身体没有危害甚至有益身体的结论,但当增加一个变量,例如性别时,我们却又发现抽烟不论是对男女都有一定程度的危害。这个例子其实涉及幸存者的问题,但更大的原因是由于样本抽取不科学,存在抽样选择性误差。
 +
 
 +
这警醒我们,在进行抽样调查时应学会选择合适的抽样方法或多种抽样方法并存,保证抽取的样本处于远离极端范围的中间区域即可。同时在进行非比例抽样时,应考虑权重的问题。
    
== 参考文献 ==
 
== 参考文献 ==
316

个编辑

导航菜单