更改
跳到导航
跳到搜索
←上一编辑
下一编辑→
辛普森悖论
(查看源代码)
2022年6月5日 (日) 19:13的版本
添加1,601字节
、
2022年6月5日 (日) 19:13
无编辑摘要
第80行:
第80行:
:1、当忽略隐藏变量时,组的大小是非常不同的。医生倾向于对严重的病例(大结石)给予较好的治疗(A) ,对较轻的病例(小结石)给予较差的治疗(B)。因此,总数由第三组和第二组支配,而不是由规模小得多的第一组和第四组支配。
:1、当忽略隐藏变量时,组的大小是非常不同的。医生倾向于对严重的病例(大结石)给予较好的治疗(A) ,对较轻的病例(小结石)给予较差的治疗(B)。因此,总数由第三组和第二组支配,而不是由规模小得多的第一组和第四组支配。
+
:2、潜伏变量对比率有很大的影响,也就是说成功率更多地受到病情严重程度的影响,而不是治疗方法的选择。因此,治疗 A组(第三组)大结石患者的情况比治疗小结石患者差,即使后者采用劣等治疗 B 组(第二组)。
+
+
== 避免辛普森悖论 ==
+
+
=== 混杂变量 ===
+
在上述的事例中,出现辛普森悖论的很大一个原因是由于存在隐藏变量,因此这便提醒我们,在进行变量设计时,一是要尽量多查阅文献以了解自变量,因变量及其他重要变量之间的关系,二是需要相关的经验,能够敏锐的察觉到某个变量的重要性。
−
:2、潜伏变量对比率有很大的影响,也就是说成功率更多地受到病情严重程度的影响,而不是治疗方法的选择。因此,治疗 A组(第三组)大结石患者的情况比治疗小结石患者差,即使后者采用劣等治疗 B 组(第二组)。
+
这个重要潜伏变量指的是与实验分析的因果都有关系的变量,这一变量的缺失可能会掩盖或颠倒研究变量的原有关系。
+
+
比如在录取率这个例子中,专业既与录取率有关,不同专业难度不同,录取率自然有差异,又与性别有关,女生和男生趋向报考的专业不同。因此专业就是一个重要潜伏变量。
+
+
=== 样本选择偏差 ===
+
某些研究在变量设计上用心良苦,但却忽略了抽取样本的代表性。关于抽烟和肺癌两者相关性的研究想必大家都有所耳闻,有些实验在进行简单二元分析后得出抽烟和患肺癌没有相关性,从而得出抽烟对身体没有危害甚至有益身体的结论,但当增加一个变量,例如性别时,我们却又发现抽烟不论是对男女都有一定程度的危害。这个例子其实涉及幸存者的问题,但更大的原因是由于样本抽取不科学,存在抽样选择性误差。
+
+
这警醒我们,在进行抽样调查时应学会选择合适的抽样方法或多种抽样方法并存,保证抽取的样本处于远离极端范围的中间区域即可。同时在进行非比例抽样时,应考虑权重的问题。
== 参考文献 ==
== 参考文献 ==
我是猫
316
个编辑
导航菜单
个人工具
登录
名字空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
集智百科
集智主页
集智斑图
集智学园
最近更改
所有页面
帮助
工具
特殊页面
可打印版本