统计数据的搜集与整理.ppt

统计数据的搜集与整理.ppt

ID:52603097

大小:430.50 KB

页数:27页

时间:2020-04-11

统计数据的搜集与整理.ppt_第1页
统计数据的搜集与整理.ppt_第2页
统计数据的搜集与整理.ppt_第3页
统计数据的搜集与整理.ppt_第4页
统计数据的搜集与整理.ppt_第5页
资源描述:

《统计数据的搜集与整理.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、总体(Population)指研究的全部对象,是由所研究具有某种共同性质的全部个体所组成的集合体。分为有限总体(finitepopulation)和无限总体(infinitepopulation)。样本(Sample)为总体的一部分,样本内包含的个体数目称为样本含量。1.1.2总体与样本2021/7/31从总体获得样本的过程称抽样,抽样的目的是希望通过对样本的研究推断其总体。抽样方法有随机抽样、分类抽样等。生物统计学上要求抽样具有代表性,应是一个总体的缩影,因此要根据具体情况采用不同抽样方法。1.1.3抽样20

2、21/7/31要求总体中的任何个体都有同等的机会被抽到;要求抽样时不受任何主观因素的影响。如抽签,抓阄,用随机数字表等。随机表的用法(附表1,自习)1.1.4随机抽样2021/7/31放回式抽样:从总体中抽出一个个体,记下它的特征后,放回总体中,再做第二次抽样。非放回式抽样:从总体中抽出个体后,不再放回。有限总体中的抽样:放回式的抽样可能会重复抽中某一个体。尤其是总体量不大,或抽样范围小的时候。无限总体在同等抽样条件下,放回式抽样和非放回式抽样没有区别。一般情况样本的含量越大越有代表性。1.1.5放回式抽样和非

3、放回式抽样2021/7/311.2.1连续型数据和离散型数据统计学的最基本工作是收集数据,数据收集得越多越有可能揭示客观现象的特性和变化规律。数据类型:连续型数据(度量数据):与某种标准做比较所得到的数据.例如:长度,时间,重量。对连续型数据进行分析的方法,通常称为变量的方法。离散型数据(记数数据):由记录不同类别个体的数目所得到的数据.例如:尾数,成活或死亡个数对离散型数据进行分析的方法,通常称为属性的方法。1.2数据类型及频率分布2021/7/311.2.2频数(率)表和频数(率)图的编绘离散型数据与连续型

4、数据的频数(率)表和频数(率)图略有不同。离散型数据频数(率)表和频数(率)图。例:调查每天出生的10名新生儿中,体重超过3kg的人数,共调查120天。每天的10名新生儿中,体重超过3kg的人数,可能有11种情况:1名也没有,有1名,有2名,…,10名都是,如表1-1的第一列所示,这一组称为组值。2021/7/31表1-1每10名新生儿体重超过3kg的人数频数(率)表2021/7/31图1-1每10名新生儿体重超过3kg的人数频数图2021/7/31例:表1-2列出了某农场做高粱“三尺三”提纯时所调查的100个

5、数据,试做其频数(率)表和频数(率)图。连续型数据频数(率)表和频数(率)图。表1-2“三尺三”株高测量结果2021/7/311、从原始数据中找出最大值和最小值,并求出极差。R=mamx-minx(R=170-141=30)2、决定划分的组数,分组数是由数据的多少决定的,美国统计学家斯特吉斯提出分组数公式:n=1+3.322lgN(式中N为样本数)。3、根据极差与决定划分的组数、确定组限。(30/10=3)4、在频数表中列出全部组限、组界及中值。5、将原始数据表中数据,填入频数表中,计算出每组的频数和频率。编制

6、连续型数据的频数(率)表的步骤:2021/7/31表1-3“三尺三”株高频数(率)表2021/7/31直方图:又称组织图,横轴表示组界,纵轴表示频数(频数图)或频率(频率图),两者图形完全一样。直方图2021/7/31多边形图(折线图):横轴表示各组中值,纵轴表示频数(率),连接各点得到多边形图。累积频数图:横轴表示各组中值,纵轴表示累积频数(率),连接各点得到累积频数(率)图(向上累积与向下累积)。频数(率)图的编绘2021/7/31根据频数(率)表或频数(率)图,可以看出数据的三个重要特征。集中情况:平均数

7、,中位数,众数。变异情况:集中在平均数两侧的程度,越集中在平均数附近说明数据越整齐。图形的形状:对称与不对称,也可能显示异常分布,出现一些不规则的情况,需要寻找原因。1.2.3研究频数(率)分布的意义2021/7/31同一总体中随机抽取的样本,其频数分布不完全相同,有时差距还很大。由于样本分布的不恒定性,当用样本去推断总体时,推断的结果也会有不同,因此,需要考察结果的可信度。为了回答这一问题,首先要对总体分布有所了解。后面的第二、三章的内容就是围绕总体展开的。1.2.4频数分布的不恒定性2021/7/31样本特

8、征数:描述样本频率分布特征的数字.1.3.1平均数:数据集中点的度量,种类很多。算术平均数:通常简称平均数。常用简单算术平均数方法,实际应用中也常用加权平均的方法来计算。几何平均数:处于稳定消长过程中生物群体的数量变化呈几何级数,如在细菌、藻类等培养,求平均消长率应采用几何平均数,若用算术平均数则偏高(几何平均数小于算术平均数)。1.3样本的几个特征数2021/7/31中位数:居于中间

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。