欢迎来到天天文库
浏览记录
ID:59440887
大小:727.50 KB
页数:91页
时间:2020-09-18
《数值变量的统计描述ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、预防医学(医学统计学部分)福建医大卫生统计系林征1第十章提纲数值变量的统计描述正态分布及其应用参数估计假设检验2统计描述统计描述就是用适当的表格、图形、数量化的指标,表达数据的数量特征,揭示其分布的规律性统计描述分为:形象化描述(统计图表)——建立对资料的初步印象;数值化的描述(统计指标)——给出分布规律及具体数值3统计描述为什么要对资料进行统计描述?医学研究得到的原始数据(rawdata)往往是庞大的、混乱的个体变异的存在,医学研究中某指标在各个体上的观察结果不是恒定不变的,但也不是杂乱无章的;从总体的角度上个体值的出现是有一定规律的,即呈一定的分布统计描述的结果为进一步的
2、统计推断提供参考4一、数值变量的统计描述某地某年随机抽查120名8岁健康男孩身高(cm)124.6126.2128.1130.6132.6125.4126.6128.4124.5129.5124.8127.8128.3131.8125.8126.8129.6125.6127.6129.8125.5120.3122.3118.2116.7121.7116.8121.6115.2122.0121.7118.8121.8124.5121.7122.7116.3124.0119.0124.5121.8124.9130.0123.5128.1119.7126.1131.3123.811
3、4.7122.2122.8128.6122.0132.5122.0123.5116.3126.1119.2126.4118.4121.0119.1166.9131.1120.4115.2118.0122.4114.3116.9126.4114.2127.2118.3127.8123.0117.4123.2119.9122.1120.4124.8122.1114.4120.5115.0122.8116.8125.8121.1124.8122.7119.4128.2124.1127.2120.0122.7118.3127.1122.5116.3125.1124.4112.3121
4、.3127.0113.5118.8127.6125.2121.5122.5129.1122.6134.5118.3132.85理想的描述结果身高例数比例(%)112~21.7114~75.8116~97.5118~1411.7120~1512.5122~2117.5124~1815.0126~1512.5128~108.3130~54.2132~32.5134~13610.86如何得到上述理想的结果?频数分布表分组划计原始资料频数分布图各项统计指标7求极差R:R=max-min确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。对于100余例的数据通常分为8-15组。
5、或根据以下经验公式:确定组距:组距i是一个组的下限与下一个组段下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即i=Int[(max-min)÷组数]列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值统计出各组的频数并整理成频数分布表1.频数表81.频数表身高例数比例(%)112~21.7114~75.8116~97.5118~1411.7120~1512.5122~2117.5124~1815.0126~1512.5128~108.3130~54.2132~32.5134~13610.892.频数分布图(直方图)10频数表与频数图的作用频数表与
6、频数图可以提供不同分组的观察人数、频率与频率密度观察分布范围及有无可疑值确定分布的类型:对称或不对称分布11对称分布儿童身高介于112~136cm间以“122~”组段的频数最多从“122~”组段向两端逐渐减少表现出以“122~”组段为中心基本对称的特点12不对称分布分布不对称者称为偏态分布skewnessdistribution偏态分布又分为正偏分布和负偏分布正偏分布positiveskewness是指分布的长尾在峰的右侧,又称右偏分布rightskewed所谓负偏分布negativeskewness是指分布的长尾在峰的左侧,又称左偏分布leftskewed13Negativ
7、eskewness:老年人生存质量自评分01020304050607080901001002003000400自评分人数14Positiveskewness:黑色素瘤患者的生存时间051015202530354045010203040生存时间(月)人数15如何更具体、精确?了解了数据分布的形态(对称与否)、是否有异常值,仅仅意味着对数据有了初步认识,尚未得到数据的“精确”特征例如:教务处得到04与05两个年级的预防医学成绩,如何判断优劣?分数段03级04级例数%例数%<6043.776.960~1917
此文档下载收益归作者所有