欢迎来到天天文库
浏览记录
ID:15951350
大小:1.88 MB
页数:112页
时间:2018-08-06
《医药数理统计方法(人卫版)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第一章数据的描述和整理一、学习目的和要求1.掌握数据的类型及特性;2.掌握定性和定量数据的整理步骤、显示方法;3.掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量;4.能理解并熟练掌握样本均值、样本方差的计算;5.了解统计图形和统计表的表示及意义;6.了解用Excel软件进行统计作图、频数分布表与直方图生成、统计量的计算。二、内容提要(一)数据的分类数据类型定性数据(品质数据)定量数据定类数据(计数数据)定序数据(等级数据)数值数据(计量数据)表现形式类别(无序)类别(有序)数值(+-×÷)对应变量定类变
2、量定序变量数值变量(离散变量、连续变量)主要统计方法计算各组频数,进行列联表分析、c2检验等非参数方法计算各种统计量,进行参数估计和检验、回归分析、方差分析等参数方法常用统计图形条形图,圆形图(饼图)直方图,折线图,散点图,茎叶图,箱形图(二)常用统计量1、描述集中趋势的统计量名称公式(原始数据)公式(分组数据)意义均值反映数据取值的平均水平,是描述数据分布集中趋势的最主要测度值,中位数Me中位数所在组:累积频数超过n/2的那个最低组是典型的位置平均数,不受极端值的影响众数Mo数据中出现次数最多的观察值众数所在组:
3、频数最大的组测度定性数据集中趋势,对于定量数据意义不大2、描述离散程度的统计量名称公式(原始数据)公式(分组数据)意义极差RR=最大值-最小值R≈最高组上限值-最低组下限值反映离散程度的最简单测度值,不能反映中间数据的离散性总体方差s2反映每个总体数据偏离其总体均值的平均程度,是离散程度的最重要测度值,其中标准差具有与观察值数据相同的量纲总体标准差s样本方差S2反映每个样本数据偏离其样本均值的平均程度,是离散程度的最重要测度值,其中标准差具有与观察值数据相同的量纲样本标准差S变异系数CVCV=反映数据偏离其均值的相
4、对偏差,是无量纲的相对变异性测度样本标准误反映样本均值偏离总体均值的平均程度,在用样本均值估计总体均值时测度偏差3、描述分布形状的统计量名称公式(原始数据)公式(分组数据)意义偏度Sk反映数据分布的非对称性Sk=0时为对称;Sk>0时为正偏或右偏;Sk<0时为负偏或左偏峰度Ku(原始数据)(分组数据)反映数据分布的平峰或尖峰程度Ku=0时为标准正态;Ku>0时为尖峰分布;Ku<0时为扁平分布*在分组数据公式中,mi,fi分别为各组的组中值和观察值出现的频数。三、综合例题解析例1.证明:各数据观察值与其均值之差的平方
5、和(称为离差平方和)最小,即对任意常数C,有证一:设由函数极值的求法,对上式求导数,得令f¢(C)=0,得唯一驻点由于,故当时f(C)y有最小值,其最小值为。证二:因为对任意常数C有故有。四、习题一解答1.在某药合成过程中,测得的转化率(%)如下:94.392.892.792.693.392.991.892.493.492.692.293.092.992.292.492.292.892.493.992.093.593.693.093.093.494.292.893.292.291.892.593.693.992.4
6、91.893.893.692.192.090.8(1)取组距为0.5,最低组下限为90.5,试作出频数分布表;(2)作频数直方图和频率折线图;(3)根据频数分布表的分组数据,计算样本均值和样本标准差。解:(1)所求频数分布表:转化率的频数分布表转化率分组频数频率累积频率90.5~10.0250.02591.0~00.000.02591.5~30.0750.1092.0~110.2750.37592.5~90.2250.6093.0~70.1750.77593.5~70.1750.9594.0~94.520.051.
7、00(2)频数直方图:频率折线图:(3)由频数分布表可得转化率分组组中值mi频数90.5~90.75191.0~91.25091.5~91.75392.0~92.251192.5~92.75993.0~93.25793.5~93.75794.0~94.594.252则=[(90.75-92.825)2×1+(91.25-92.825)2×0+…+(94.25-92.825)2×2]=0.584或者=≈0.76422.测得10名接触某种病毒的工人的白细胞(109/L)如下:7.1,6.5,7.4,6.35,6.8,7
8、.25,6.6,7.8,6.0,5.95(1)计算其样本均值、方差、标准差、标准误和变异系数。(2)求出该组数据对应的标准化值;(3)计算其偏度。解:(1),n=10462.35样本均值方差标准差=≈0.609标准误变异系数CV===8.99%;(2)对应的标准化值公式为对应的标准化值为0.534,-0.452,1.026,-0.698,0.041,0.78
此文档下载收益归作者所有