资源描述:
《my分析样本估计总体水平复习》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、必修3复习-统计永兴一中曹水林统计知识点:1、抽样方法。(1)简单随机抽样(2)系统抽样(3)分层抽样2、样本分布估计总体分布(1)频率分布表(2)直方图(3)折线图(4)散点图(5)茎叶图3、样本特征数估计总体特征数(1)平均数(2)方差(3)众数(4)中位数4、线性回归方程。复习回顾1你学过哪几种随机抽样方法?简单随机抽样系统抽样分层抽样抽签法随机数法2,简单随机抽样、系统抽样、分层抽样的比较类别共同点各自特点联系适用范围简单随机抽样(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它
2、放回,即不放回抽样从总体中逐个抽取总体中个体 较少将总体平均分成几部分,按预先制定的规则在各部分抽取在起始部分时采用简单随机抽样总体中个体较多系统抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成分层抽样总体:在统计中,所有考察对象的全体。个体:总体中的每一个考察对象。样本:从总体中抽取的一部分个体叫做这个总体的一个样本。样本容量:样本中个体的数目。总体、个体、样本、样本容量频率分布:是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率
3、分布。频率分布直方图的特征:(1)从频率分布直方图可以清楚的看出数据分布的总体趋势。(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。1,众数、中位数、平均数的概念中数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.一,用样本的数字特征估计总体的数字特征平均数:一组数据的算术平均数,即x=2,标准差是样本平均数的一种平均距离,一般用s表示.考察样本数
4、据的分散程度的大小,最常用的统计量是标准差.二,分析样本,估计总体(1)分析样本的分布情况(2)分析样本的特征数样本的频率分布表样本的频率分布直方图样本的茎叶图频率分布:是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。频率分布直方图的特征:(1)从频率分布直方图可以清楚的看出数据分布的总体趋势。(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。样本的频率分布直方图作样本频率分布直方图的步骤:(1)求极差;(2)决定组距与组数
5、;(组数=极差/组距)(3)将数据分组;(4)列频率分布表(分组,频数,频率);(5)画频率分布直方图。样本的频率分布表(1)找全距(2)分组(3)找频数,计算频率,列表作频率分布直方图的方法:把横轴分成若干段,每一线段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的频率/组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图。茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它
6、的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。3.制作茎叶图的方法:将所有两位数的十位数字作为“茎”,个位数字作为叶,茎相同者共用一个茎,茎
7、按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。注意:相同的得分要重复记录,不能遗漏。茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39茎叶图甲乙01234525541616794908463683891(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2
8、)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39二、众数、中位数、平均数与频率分布直方图的关系1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。2、在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.,由此可以估计中位数的值。但注意由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.三,三种数字特征的优缺点1、众数体现了样本数据的最