222用样本数字特征分布估计总体数字特征 (2).ppt

222用样本数字特征分布估计总体数字特征 (2).ppt

ID:48893503

大小:3.03 MB

页数:29页

时间:2020-01-28

222用样本数字特征分布估计总体数字特征 (2).ppt_第1页
222用样本数字特征分布估计总体数字特征 (2).ppt_第2页
222用样本数字特征分布估计总体数字特征 (2).ppt_第3页
222用样本数字特征分布估计总体数字特征 (2).ppt_第4页
222用样本数字特征分布估计总体数字特征 (2).ppt_第5页
资源描述:

《222用样本数字特征分布估计总体数字特征 (2).ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、2.2.2用样本的数字特征估计总体的数字特征在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?问题为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。——用样本的数字特征估计总体的数字特征。1、众数在一组数据中,出现次数最多的数据叫做这一组数据的众数.2、中位数将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数.3、平均数(1)x=(x1+

2、x2+……+xn)/n(2)x=x1f1+x2f2+……xkfk甲在一次射击比赛中的得分如下:(单位:环).7,8,6,8,6,5,9,10,7,5,则他命中的平均数是_____,中位数是众数是_____2.某次数学试卷得分抽样中得到:90分的有3个人,80分的有10人,70分的有5人,60分的有2人,则这次抽样的平均分为______.7.177分练习75,6,7,8众数:若有两个或两个以上的数据出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数。中位数:唯一确定的。不受极端值的影响,仅利用了数据中排在中间数据的信息。当样本数据质量比较差,即

3、存在一些错误信息时,应该用抗极端性很强的中位数表示数据的中心值。平均数:任何一个样本数据的改变都会引起平均数的改变。月均用水量/t频率/组距o4.543.532.521.510.50.500.400.300.200.10如何从频率分布直方图中估计众数?如图:2.25众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。思考:频率分布直方图中估计的众数与原始数据中的众数2.3不同,为什么?在频率分布直方图,我们只能直观地看出数据的大概分布情况,从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。讨论:众数估计总体情况有什么优缺点?能够体现样本数据的最大集中点,

4、但它对其它数据信息的忽视使得无法客观地反映总体特征。如何从频率分布直方图中估计中位数?0.020.040.060.140.250.220.150.080.04月均用水量/t频率/组距o4.543.532.521.510.50.500.400.300.200.10前四个小矩形的面积和=0.492.02后四个小矩形的面积和=0.26分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。总结:在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标称为中位数。

5、注:图中的数据是小矩形的面积即频率上图中,设中位数为x,则思考:2.02这个中位数的估计值,与样本数据的中位数2.0不同,为什么?从频率分布直方图本身得不出原始的数据内容,频率分布直方图已经损失一些样本信息。思考:中位数不受少数极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?考察100位居民的月均用水量表中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中人为操作的失误经常造成错误数据。对极端值不敏感有利的例子:某人具有初级计算机专业技术水平,

6、想找一份收入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感。这里更好的方法是同时用平均数和中位数来作为参考指标,选择平均数较大且中位数较大的公司就业。对极端值不敏感有弊的例子:如何从频率分布直方图中估计平均数?注:图中的数据是小矩形的面积即频率0.020.040.060.140.250.220.150.080.04月均用水量/t频率/组距o4.543.532.521.510.50.500.400.300.200.10........0.

7、250.751.251.752.25.2.753.253.754.25平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。2.02应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息.但平均数会受到极端数据2200万元的影响,所以大多数项目投资金额都和平均数相差比较大.练习课本P74练习三种数字特征的优缺点特征数优点缺点众数体现了样本数据的最大集中点无法客观反映总体特征中位数不受少数极端值的影响不受少数极端值的影响有时也是缺点平均数与每一个数据有关,更能反映全体

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。