_辛普森悖论及其应用思考

_辛普森悖论及其应用思考

ID:12787839

大小:251.67 KB

页数:4页

时间:2018-07-19

_辛普森悖论及其应用思考_第1页
_辛普森悖论及其应用思考_第2页
_辛普森悖论及其应用思考_第3页
_辛普森悖论及其应用思考_第4页
资源描述:

《_辛普森悖论及其应用思考》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、职教实务·技术应用辛普森悖论及其应用思考□柳州铁道职业技术学院吴昊18广西教育2013.3职教实务·技术应用【摘要】探讨现实中的辛普森现象,利用辛普森悖论来解释现实生活中的例子,探讨例子发生矛盾的原因,加深对辛普森现象的理解,进而对现实分析的情况进行深入思考并提供作出正确判断的理论依据。【关键词】辛普森悖论分层抽样统计混杂因素【中图分类号】G【文献标识码】A【文章编号】0450-9889(2013)03C-0186-04一、辛普森悖论统计分析中,变量间是否有相关关系,常常会左右我们对观察的现象作出正确的决策。例如,某公司开发一种新药A,想要研究这种新药跟传统的药物B对疾病的处

2、理效果有什么不同。选择800个人来参与做实验,分成两组,每组400人,两组的结果如表1所示。疗效合计有效率有效无效处理新药20020040050%传统药物24016040060%合计440360800表1男女一起考虑的实验数据反,也就是说不管是男性患者还是女性患者,新药的有效率都高于传统的药物,这就跟前面的分析出现了矛盾,这就是辛普森现象或称为辛普森悖论。辛普森悖论是在一定的前提条件下,研究两种变量的相关关系时,利用分组或分层技术对原来总体再进行分析得到的与未分组或分层抽样之前相反的一种结论。即分组评价都占优的一方在总体评价中却不占优势。辛普森现象并不是一种稀罕的现象,在现

3、实生活中非常普遍,特别是在社会科学和医学中。医学上新开发的药物对疾病是否有效,新入学的学生是否受到性别的歧视,中国经济的腾飞与生活水平的降低,吸烟是否有害健康,等等,现实中的方方面面都会出现辛普森现象。用辛普森悖论来解释这些现象能真正了解现象的本质,从而使人们作出正确的决策。本文的目的是总结前人的分析结果,去探讨周围的辛普森现象,为大家进一步认清现象提供一些合理的解释及思考。二、辛普森悖论的数学表示及相应问题一起来看一个向量图。详见图1。18广西教育2013.3职教实务·技术应用18广西教育2013.3职教实务·技术应用从表1的结果看,新研发的药物的有效率是50%,低于传统药

4、物的60%,对于治疗某种疾病来说,显得新研发的药物的价值低于传统药物。那么对这种新研发的药物的有效率经过统计分析后是否如表1所示?把表1得到的数据再进行分层抽样处理,在细分成男性跟女性对药物的有效率后得到的信息如表2、表3所示。表2男性实验数据疗效合计有效率有效无效处理新药12018030040%传统药物307010030%合计150250400表3女性实验数据疗效合计有效率有效无效处理新药802010080%传统药物2109030070%合计290110400从表2和表3来看,得到的结论和表1得到的结论刚好相图1药物治疗数据图1是根据上文第一部分辛普森悖论中的数据得到的向

5、量图。从图1可以看出,当把数据用向量在图中表示时,向量的斜率就表示药物治疗的有效率,倾斜的角度越大有效率就越高。在分性别讨论时,上面两条就表示女性的传统药物与新药治疗的有效率,下面两条就表示男性的传统药物与新药治疗的有效率,根据相应的斜率可以知道新药治疗的有效率都比传统治疗的有效率要高。但不讨论性别时,表示传统治疗的有效率的斜率反而比表示新药治疗有效率的斜率大,也就是传统治疗的效果更好。这也是我们之前讨论分析的结果。那么,从数学上看,辛普森悖论也就是两个相对斜率较小的向量相加后反而比两个相对斜率较大的向量相加要大。什么时候才会出现这种情况呢?更一般的,记(1)P(A

6、B)>P

7、(A

8、B');(2)P(A

9、B)

10、B'C')且P(A

11、BC')

12、B'C')。18广西教育2013.3职教实务·技术应用18广西教育2013.3职教实务·技术应用其中“P(A

13、B)”表示B发生时A发生的条件概率,“B'”表示B不发生,“C”表示混杂因素。忽略了性别这个因素,得到的结论却不再一样。像与性别有一样影响的因素也就称为混杂因素。如果在使用数据的过程中把这类因素忽略掉将会混杂真正的因果关系,从而得到错误结论。式子(1)说明B发生时A发生的条件概率比B不发生时A发生的条件概率大,式子(2)说明B发生且C发生时A发生的条件概率比B不发生且C发生时A发生的条件概

14、率小,同时还有,B发生且C不发生时A发生的条件概率比B不发生且C不发生时A发生的条件概率小。在加入C这一条件后,我们看到无论是在C发生还是不发生的背景下,B发生时A发生的条件概率都比B不发生时A发生的条件概率小。这就与前面式子(1)矛盾了。这里我们可以看出“C”导致这种矛盾出现的因素。若(2)成立则有(1)成立,这种现象就称为辛普森悖论。针对前述表1至表3的例子,若用符号表示如下:记“A”表示药物有效,“A'”表示药物无效,“B”表示所用的药为新药,“B'”表示所用的药为传统药物,“C”表示选择男性作试

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。