第3章 平均数、标准差与变异系数

第3章 平均数、标准差与变异系数

ID:65546973

大小:402.00 KB

页数:35页

时间:2024-08-29

上传者:U-3745
第3章 平均数、标准差与变异系数_第1页
第3章 平均数、标准差与变异系数_第2页
第3章 平均数、标准差与变异系数_第3页
第3章 平均数、标准差与变异系数_第4页
第3章 平均数、标准差与变异系数_第5页
第3章 平均数、标准差与变异系数_第6页
第3章 平均数、标准差与变异系数_第7页
第3章 平均数、标准差与变异系数_第8页
第3章 平均数、标准差与变异系数_第9页
第3章 平均数、标准差与变异系数_第10页
资源描述:

《第3章 平均数、标准差与变异系数》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

第3章平均数、标准差与变异系数 数据有两种变化趋势:集中趋势和离散趋势。表示数据集中趋势的指标有多个,如平均数(算术平均数、几何平均数)、中位数、众数,使用最多的是算术平均数。表示数据离散趋势的指标有多个,如极差、平均离差、方差与标准差,使用最多的是方差与标准差。 资料中各观察值的总和除以观察值的个数所得的商,称为算术平均数,简称为平均数或均数。用符号表示。平均数的意义:平均数用来描述资料的集中性,即指出资料中数据集中较多的中心位置,常用于同类性质资料间的相互比较。一、集中趋势 计算方法1.直接法适用于样本含量较小的非频数资料如果一个含量为n的样本,其n个观察值分别用x1、x2……xn表示,则它们的平均数为其中,(Sigma)为总和符号,表示从第一个观察值x1累加到第n个观察值xn,若在意义上已明确时,简记为x。 常数的总和等于该常数的n倍,即代数和的总和等于总和的代数和,即总和符号内的常数因子可以提取到总和符号之外,即其中C为常数(a为常数)关于总和符号的几个性质 2.加权法如果样本中有n1个x1,有n2个x2,那么,n1+n2个数的平均数是加权平均数。同理:各组的次数fi是权衡各组中值xi在资料中所占比重大小的数量,因此f被称为是x的“权”,加权法也由此而得名。 在计算离散型频数资料的平均数时,式中x为组值,f为频数,N为总频数(∑f),k为组数。 表3-150只小鸡出壳天数的频数分布表 在计算连续型频数资料的平均数时,式中m为组中值,f、N和k同上式。 组别组中值m频数(f)fm44.25—45.029045.75—46.529347.25—48.01048048.75—49.51259450.25—51.026132651.75—52.544231053.25—54.043232254.75—55.5291609.556.25—57.01162757.75—58.515877.559.25—60.0212060.75—61.54246合计20010695表3-2某纯系蛋鸡200枚蛋重的频数分布表=10695/200=53.475 平均数有以下几个基本特性:(1)平均数的计算与样本内每个值都有关,它的大小受每个值的影响。(2)若每个xi都乘以相同的数k,则平均数亦应乘以k。(3)若每个xi都加上(或减去)相同的数A,则平均数亦应加上(或减去)A。 中位数(median)将资料中所有观察值从小到大依次排列,处于中间位置的数。以Md表示。适用条件资料呈偏态分布或频数分布类型不明,以及一端或两端无确定数值,这种资料用中位数作为代表值比用算术平均数为好。非频数资料,先将各观察值由小到大排列,当n为奇数时,第(n+1)/2位置的观察值即为中位数,即:Md=x(n+1)/2 其中:L—中位数所在组的下限;i—组距;f—中位数所在组的频数;n—总频数;c—小于中数所在组的累积频数。当n为偶数时,和位置的两个观察值之和的二分之一即为中位数,即:若资料已分组,并编制成了频数分布表,可利用频数分布表计算中数。 潜伏期(小时)病例数f累计例数0——252512——588324——4012336——2314648——1215860——516372——1164[例]某地区有164人因沙门氏菌食物中毒,其潜伏期资料经整理如下表,试计算中位数。 众数(Mode)资料中出现次数最多的那个数或频数最多一组的组中值,记为Mo。 fmax=24,Mo=2250只小鸡出壳天数的频数分布表Md=22 组别组中值m频数(f)fx44.25—45.029045.75—46.529347.25—48.01048048.75—49.51259450.25—51.026132651.75—52.544231053.25—54.043232254.75—55.5291609.556.25—57.01162757.75—58.515877.559.25—60.0212060.75—61.54246合计20010695表3-2某纯系蛋鸡200枚蛋重的频数分布表=10695/200=53.475fmax=44,Mo=52.5Md=53.35 几何平均数(Geometricmean)定义指n个观察值乘积的n次方根。即适用条件主要应用于数据呈倍数关系或不对称分布的资料,算术平均数对这类资料的代表性差。如抗体效价(1:10,1:100,1:1000,1:10000)、增长率或生长率、动态发展速度等。 计算1、应用公式计算(实际应用时常取对数) 例海虾养殖试验,各旬的生长速度3.0,1.51.3,1.2,1.2,1.1,1.1,求海虾的旬平均生长速度。解:即海虾平均生长速度为1.38。其算术平均数为 当资料编成频数分布表时,—各组组中值;—各组次数; 二、离散趋势资料的另一方面的特征是变异程度。如:A组资料:3、4、5、6、7平均数为:5 B组资料:1、3、5、7、9平均数为:5这里的平均数5对于A组资料的代表性好?还是对于B组资料的代表性好?  可见,只表明了数据的集中程度是远远不够的,还需要进一步说明数据的变异程度。只有通过变异程度的描述,才知道代表值的代表性。表示数据变异特征的数值叫变异数。常用的变异数有:极差、平均离差、方差、标准差、变异系数等。 极差(全距)极差=最大值-最小值只利用了资料中最大值和最小值,不能准确表达资料中各个观察值的变异程度。平均离差 它不能表示整个资料中所有观察值的总偏离程度使用不方便,在统计学中未被采用消除离均差的负号离均差的平方之和(简称平方和,记为SS)称为均方(缩写为MS),又称为样本方差,记为S2标准差S离均差 首先求出离均差,即每个数与它们的平均数之间的离差;然后将所有的离均差平方,再相加,得出离均差平方和;最后用n-1除离均差平方和(按照统计学理论,不要用样本含量n去除),所得的商称为样本方差,用符号s2表示。方差s2是离均差平方的平均数。虽然方差在实际应用中用得最广泛,但因它的单位是原始数据单位的平方,所以它不能直接地指出某个数x与平均数之间的偏离究竟达到什么程度。为此,采用标准差s做标准,衡量x与平均数之间的离散程度。 自由度(degreeoffreedom):统计学借此来反映一批变量的约束条件。例如一个有5个观察值的样本,因为受到统计数的约束,在5个离均差中,只有4个数值可以在一定范围内自由变动取值,而第五个离均差必须满足这一限制条件。自由度记作DF,一般样本自由度等于观察值个数(n)减去约束条件的个数(k),即DF=n-k。 样本方差样本标准差 为了方便计算,将离均差平方和转化为另一种形式,同时略去下标,上式可表示为: 在计算离散型频数资料的标准差时,式中x为组值,f为频数,N为总频数(∑f),k为组数。 在计算连续型频数资料的标准差时,式中m为组中值,f、N和k同上式。 标准差的特性(一)标准差的大小受资料中各观察值的影响,观察值间变异大的标准差也大,反之则小;(二)计算标准差时,各观测值加上或减去一个常数,标准差的值不变;(三)当每个观察值都乘以一个常数a时,所得的标准差是原来标准差的a倍. 样本的方差为总体的方差为 变异系数Coeffcientofvariation资料的单位不同或平均数相差很大时,直接利用标准差比较资料间变异程度是不妥的,需用变异系数。变异系数同标准差一样是衡量资料变异程度的统计量。变异系数消除了不同单位和平均数的影响,可以用来比较不同资料的相对变异程度。 变异系数是标准差与平均数的比,记为CV。两个小麦品种株高变异的比较 特点和作用(一)变异系数是一个无单位的相对数;(二)变异系数同时受到平均数和标准差的影响,因此,在利用变异系数来表示资料的变异程度时,最好将平均数和标准差也列出。(三)变异系数不受单位不同或平均数不同的影响,对于单位不同和平均数不同的资料,都可以用变异系数来比较其

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
最近更新
更多
大家都在看
近期热门
关闭