定性变量的统计描述

定性变量的统计描述

ID:42947810

大小:3.96 MB

页数:121页

时间:2019-09-26

定性变量的统计描述_第1页
定性变量的统计描述_第2页
定性变量的统计描述_第3页
定性变量的统计描述_第4页
定性变量的统计描述_第5页
资源描述:

《定性变量的统计描述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三章:定性变量的统计描述错觉的误导70%的交通事故是由没有饮酒的驾驶者造成的,一个酒鬼对这个信息的反应就是:“那么,我还想要一杯啤酒。研究发现,在所有车祸中,坐在左右座位中的死亡的比例最低,所以坐在中间最安全。一个能使90%的病人活下来的手术,会让我们乐观地展望未来;而一个会使10%的病人死亡的手术,则会使我们异常悲观。我们已经讨论了谋杀、殴打和死亡等一些令人不愉快的话题。与老年人相比,青少年被误认为是具有较多自杀倾向的一类人群,这一基本判断就是建立在错误的比较基础上的。一家德国报纸文章“老年时会变得更幸福”分析论证了下面的结果:在20岁以下的青少年中,自杀在所有死亡中所占的比例最大,

2、共计25%。而30~40岁的人自杀率占到10%,超过70岁的老年人自杀率不足2%。“年龄越大,决定自杀的比率就越低,”这家报纸如此写道,因此我们会随着年龄的不断增长而变得越来越幸福。事实事实正好相反。随着年龄的不断增长,自杀率在上升,20岁以下的青少年自杀率不足1/105,70岁以上老年人的自杀率则几乎达到50/105。我们的年龄越大,就越容易做出决定,自愿结束自己的生命,这种现象存在于各个国家的各个时期。然而,自杀在青少年那里的确起着一个非常显著的作用,其原因主要是青少年一般来说很少自然死亡。他们很少患癌症和循环系统疾病,中风或肝脏损伤在青少年中也很少发生。换句话说,在青少年年龄段,事

3、故、谋杀和自杀几乎是主要的死亡原因,而自杀在各类死亡中所占的比例又比较高。明白了这个道理,对于青少年的高自杀率,人们自然也就不会大惊小怪了。【案例】某年甲乙两地发生麻疹流行,甲地发病人数为300人,乙地发病人数为250人,甲地发病人数比乙地多50人,能否据此认为甲地麻疹发病比乙地严重呢?.【案例】某年甲乙两地发生麻疹流行,甲地发病人数为300人,乙地发病人数为250人,甲地发病人数比乙地多50人,能否据此认为甲地麻疹发病比乙地严重呢?.目的:比较甲、乙两地麻疹的发病情况。问题1.甲地麻疹发病比乙地严重吗?问题2.该怎样表示两地麻疹发病强度??绝对数相对数分类资料的统计描述常用相对数往往先

4、统计具有某种属性的个体数,进而用相对数来描述和比较这类变量。相对数(Relativenumber)的概念:是两个具有内在联系的指标之比。包括频率(FrequencyorProportion)强度(Intensity)相对比(Relativeratio)第一节定性变量频率分布定性资料频率分布表/图特点:能描述一个全面的分布特征,即把所有各种可能性的特征都给描述出来。相对数指标特点:从某个侧面来描述定性变量,尽管不一定能全面的描写某分布,但有助于统计描述和推断。相对数指标频率分布表/图分布特征频率型指标强度型指标相对比指标一、多分类变量的频率分布表3-1某课题组为了解城乡居民慢性病的患病情况

5、,于2010年对某地区城乡25个社区的居民进行了调查。课题组对资料进行了整理,将1381例被访者和284例慢性病患者按职业分组制成频数表见表3-1表3-12010年某地区被访者和慢性病患者按职业分组的频率分布图3-12010年某地区调查的被访者和慢性病患者的职业分布图3-22010年某地区慢性病患者的职业分布二、二分类变量的频率分布患慢性病的频率占:284/181=20.6%不患病的频率占:1-20.6%=79.4%(2)所以对这样一个二项分类来说,用一个20.6%就能描述整个资料的频率分布。表3-22010年某地区1381例被访者是否慢性病患者的频率分布二分类资料,对1381名被访者中

6、,农民患病的频率占19.8%,不患病的占80.2%。表3-32010年某地区1381例被访者按职业分组的慢性病患病率图3-32010年某地区1381例被访者不同职业的慢性病的患病率(%)患病率(%)表3-42010年某地区1381例被访者按职业和性别分组的慢性病患病率图3-4某地区1381例被访者按职业和性别分组的慢性病患病率(%)第二节常用相对数指标一、频率型指标(Frequency)指某现象发生的频率,或表示事物内部某个组成成分所占的比重或分布。频率的特征:分子是分母的一部分;无量纲,在0~1之间取值。计算公式:麻疹患者300人甲地30000人二、强度(intensity)强度是流行

7、病学、统计学术语,指单位时间内某现象发生的频率。分母含有时间,指单位时间内的频率;其统计学本质为频率强度,即概率强度的近似值。计算公式:特点:“人时”:人×观察时间(年、月)举例:10个人观察1年单位“人年”10人年1个人观察10年有3个人,第1个人观察10年第2个人观察5年第3个人观察1年16人年相当于16个人观察了1年∴观察人时的总和=单位时间×折合的观察人数1个人观察1年1人年≈单位时间内新发生的概率式中的K为比例基数,可以为

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。