数据资料的特征值

数据资料的特征值

ID:39449961

大小:415.00 KB

页数:21页

时间:2019-07-03

数据资料的特征值_第1页
数据资料的特征值_第2页
数据资料的特征值_第3页
数据资料的特征值_第4页
数据资料的特征值_第5页
资源描述:

《数据资料的特征值》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二章数据资料的特征值离散性特征值集中性特征值生物学数据资料(观测值)的分布具有两个重要的特征:集中性离散性观测值向中心位置聚集的趋势反映数据资料集中性的特征值是平均数观测值偏离中心位置的分散情况反映数据资料离散性的特征值是极差、方差、标准差和变异系数等众数算术平均数几何平均数调和平均数中位数第一节集中性特征值平均数(mean)是统计学中最常用的统计量,用来表明数据中各观测值相对集中较多的中心位置,反映了一组观察值的平均水平,是一组数据资料的代表值◇可以用来说明一组数据资料的平均水平或集中趋势,具有典型性◇可以用来进行组间比较,以判断一组数据资料与另一组数

2、据资料的差别,具有代表性平均数的作用:1.算术平均数算术平均数(arithmeticmean):数据资料中各观测值的总和除以观测值的个数所得的商,简称平均数或均数。记为1.1基本概念■算术平均数适合描述对称分布资料的集中趋势1.2计算公式观测值为:x1,x2,…,xn,则:对于总体来说,则有:设有一随机变量x,1.3重要性质样本各观测值与平均数之差的和为0,即离均差之和为0证明样本各观测值与平均数之差的平方和为最小,即离均差平方和最小证明则有:1.4加权平均数对于样本容量≥30且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数xi—第i组的组中值

3、fi—第i组的次数k—组数采用加权法计算得到的平均数就称为加权平均数(weightedmean)加权平均数不具备算术平均数的两个性质几何平均数(geometricmean):n个观测值相乘之积的n次方根■适用于利率、畜禽数的增长率、药物的效价、抗体的滴度等非线性数据例1为研究人群中流感的抗体水平,测得12名儿童的血清对流感病毒的血凝抑制抗体效价的倒数为:5,5,5,5,5,5,5,10,10,10,20,40,试计算平均血凝抑制抗体效价。解:答:平均血凝抑制抗体效价约为1∶8平均血凝抑制抗体效价约为1∶102.几何平均数3.调和平均数调和平均数(harmo

4、nicmean):资料中各观测值倒数的算术平均数的倒数■调和平均数主要适用于速度类的资料,或有个别极端大观测值的数据资料4.中位数中位数(median):将资料中所有观测值按从小到大依次排列,位于中间位置的那个观测值,简称为中数5.众数众数(mode):在数据资料中出现次数最多的一个观测值或次数最多一组的组中值有的资料可出现多个众数,有的资料则没有众数当观测值的个数是偶数时,以中间两个观测值的平均数作为中位数■数据资料呈偏态分布或分布情况不清楚时,中位数的代表性优于算术平均数第二节离散性特征值平均数主要是用来说明数据的集中趋势和集中程度的,是一组数据的代表

5、值平均数的代表性如何,还要看数据的变异情况:数据越是集中,则平均数的代表性就越强仅用平均数对一个数据资料的特征进行统计描述是不完善的,还必须要有另外一个统计量来衡量数据变异程度的大小、说明平均数的代表性数据越是分散(离散),则平均数的代表性就越弱用来衡量数据变异程度的统计量有很多,常用的有:极差、方差、标准差和变异系数1.极差极差(range):数据资料中最大观测值与最小观测值之间的差■极差主要用来说明传染病和食物中毒的最短、最长潜伏期(1)没有充分利用数据中全部观测值的信息优点:极差是衡量数据资料变异程度大小的最简便的统计量缺点:(2)不能准确反映数据中

6、各观测值的分布状况(3)样本之间难以进行比较(4)极差的抽样误差较大,不稳定2.方差极差:仅用全部观测值中较为特殊的两个点值,比较粗糙充分利用数据资料中的每一个观测值,将每一观测值都和某一个特定的值相比,可以求出每一个观测值与平均数的差值,即离均差有多少个观测值就可以得到多少个离均差,还是不能说明整个数据资料的变异程度将各个离均差相加是最简单的方法,■可以用离均差平方和来衡量数据的变异程度仅仅进行简单地相加,还是不能反映数据资料中所有观测值的总偏离程度最理想的特定值就是平均数根据平均数的第二个性质可知,离均差平方和最小,也就是说将离均差平方后相加之和是最稳

7、定的一个值,而且这个值不等于0离均差平方和简称为平方和(sumofsquares),用SS表示样本平方和:总体平方和:用平方和衡量数据的变异程度:离均差平方和消除了离均差正、负值的影响离均差平方和的大小除了与变异程度有关外,还随样本容量的大小而改变为了消除样本容量大小的影响,可以取其平均数,即用平方和除以样本容量,即平方和的平均数称为方差(variance)为了使所得的统计量是相应总体参数的无偏估计量,在求离均差平方和的平均数时,分母不用样本容量n,而用自由度n-1样本方差:总体方差:样本均方S2是总体方差σ2的无偏估计值3.标准差用方差衡量数据的变异程度

8、:■同类资料进行比较时,方差越大就意味着数据资料的变异程度越大,因

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。