资源描述:
《2017.3.16-统计学-计量资料地统计描述方法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、实用文档计量资料的统计描述方法怎样表达一组数据?描述计量资料的常用指标—A、描述平均水平(中心位置):均数、中位数和百分位数、几何均数G、众数(mode)B、描述数据的分散程度:标准差、四分位数间距、变异系数、方差、全距(一)均数mean和标准差standarddeviation1.(算术)均数均数是描述一组计量资料平均水平或集中趋势的指标。*直接计算公式:应用条件:适用于对称分布,特别是正态分布资料。2.中位数(median)M和百分位数(percentile)A.中位数M文案大全实用文档是将一组观察值从小到大排序后,居于中间位置的那个值或两个
2、中间值的平均值。应用条件:用于任何分布类型,包括偏态资料、两端数据无界限的资料。计算:n为奇数时--n为偶数时--9人数据:12,13,14,14,15,15,15,17,19天B.百分位数是将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X百分位数。中位数是第百分50位数。文案大全实用文档四分位数间距(quartilerange)=第25百分位数(P25)~第75百分位数(P75)。四分位数间距用于描述偏态资料的分散程度(代替标准差S),包含了全部观察值的一半。百分位数计算(频数表法)::第X百分位数所在组段下限:小于各
3、组段的累计频数:第X百分位数所在组段组距:总例数fx:所在组段频数注:有的教材X=r;=C例:求频数表的第25、第75百分位数(四分位数间距)组段频数累积频数∑f56~22文案大全实用文档59~5762~1219∑f25L2565~1534P25在此68~255971~2685∑f75L7574~19104P75在此77~1511980~1012983~851130合计130①确定Px所在组段:P25所在的组段:nX%=130×25%=32.5,65~组最终的累积频数=34,32.5落在65~组段内;P75所在的组段:nX%=130×75%=97
4、.5,此值落在74~组段②确定Px所在组段的、、fx、③P25=65+3x[(130x25%-19)/15]=65.90P75=74+3x[(130x75%-85)/19]=74.66四分位数间距=65.90~74.66(次/分)3.几何均数G(geometricmean)应用:文案大全实用文档适用于成等比数列的资料,特别是服从对数正态分布资料。原始数据分布不对称,经对数转换后呈对称分布的资料。可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。例如抗体滴度。计算:N个数值的乘积开N次方,即为这N个数的几何均数。有8份血清的
5、抗体效价分别为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗体效价。使用分母计算!平均抗体效价为:1:57加权法:文案大全实用文档众数是一组观察值中出现频率最高的那个观察值;若为分组资料,众数则是出现频率最高的那个组段的组中值。适用于大样本但较粗糙。例:有16例病人的发病年龄为42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,试求众数。正态分布时:均数=中位数=众数正(右)偏态分布时:均数>中位数>众数负(左)偏态分布时:均数<中位数<众数3.标准差SS描
6、述数据的分散程度.描述一组数据在其平均数周围的分布情况,若每个数据集中在其平均数周围,此平均数对这组数据的代表照就大;反之,代表性较差。标准差S甲组7580859095100105n1=71=90s1=10.8乙组45607590105120135n2=72=90s2=32.4,分子越大。或者文案大全实用文档标准差的5应用:描述变异程度、计算标准误、计算变异系数、描述正态分布、估计正常值范围S用于正态分布资料怎样使用均数和标准差?论文中常用±S描述对称、正态或近似正态分布数据的特征。描述偏态资料的分散程度需用四分位数间距P25~P75(代替标准差
7、S)。方差:方差=S2全距R:R=最大值–最小值。简单,但仅利用了两端点值,稳定性差。变异系数(coefficientofvariation,CV):计算:CV=(S/)´100%,无单位应用:1.单位不同的多组数据比较;文案大全实用文档2.均数相差悬殊的多组资料什么是正态分布?(二)正态分布(Normaldistribution)正态分布是描述连续型变量值分布的曲线.当例数比较多时,医学上许多资料近似服从正态分布。正态分布在统计推断上有重要的作用。正态分布曲线理论上的特征(1)以X=μ均数为中心,X值呈钟型分布,中央高、两端对称性文案大全实用文
8、档减少、与X轴永不相交。(2)在X=μ处,f(x)取最大值(例数最多)。(3)正态分布由均数μ、标准差σ决定曲线的左右位置和高低形状:正