北大描述统计课件.ppt

北大描述统计课件.ppt

ID:56330610

大小:919.00 KB

页数:84页

时间:2020-06-11

北大描述统计课件.ppt_第1页
北大描述统计课件.ppt_第2页
北大描述统计课件.ppt_第3页
北大描述统计课件.ppt_第4页
北大描述统计课件.ppt_第5页
资源描述:

《北大描述统计课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、描述统计描述统计:描述一组数据的分布特征。统计图表条形图(棒图):表示分类变量等离散性数据资料圆形图(饼图):表示分类变量等离散性数据资料直方图:表示等比或等距变量等连续性数据资料折线图:表示等比或等距变量等连续性数据资料茎叶图:将每一数字分解为左边部分(称为茎)和右边部分(称为叶).如果数字是两位数,左边的一位就是茎,右边的一位就是叶茎叶图兼具次数分布表和直方图的双重优点,有非常高的实用价值。历年真题等距量表的特点是(B)(2007,全国统考)A.无绝对零点,无相同单位B.无绝对零点,有相同单位C.有绝对零点,无相同单位D.有绝对零

2、点,有相同单位次数分布表简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编织成的统计表。——————————————血型人数—————————————A143B182AB98O102—————————————分组次数分布表:当数据量很大时,把所有数据先划分为若干组,将数据按数值大小划归到相应组别内,分别统计各组别中数据的个数,用列表形式呈现出来。相对次数分布表:将次数分布表中各组的实际次数转化为频率比率(f/N)或百分比等项对此书来表示。累积次数分布表:把各组次数由下而上或由上而下累加在一起。双列次数分布表:又称相关

3、次数分布表,把有联系的两列变量用同一个表表示其分布。集中量数集中趋势与离中趋势是次数分布的两个基本特征。数据的集中趋势就是指数据分布中大量数据向某方向集中的程度。用于描述数据集中程度的统计量,就是集中量数。算术平均数、中数、众数、加权平均数、几何平均数、调和平均数等。算术平均数简称平均数(average)或均数、均值(mean)表示:μ、M、、计算:例:有一组数据如下,计算它们的平均数:34,36,29,33,34,30解:=(34+36+29+33+34+30)/6=32.67特点:1)在一组数据中每个变量与平均数之差(离差)的总和

4、等于0。2)在一组数据中,每个数都加上一个常数C,所得平均数为原来的平均数加常数C。3)在一组数据中,每个数都乘上一个不为0的常数C,所得平均数为原来的平均数乘常数C。意义:1)应用最普遍的集中量数。2)是“真值”最佳无偏的估计值。优点:1)反应灵敏。2)计算简单、严密。3)简明易懂。4)便于进一步统计。5)受抽样影响小。缺点:1)受极端值影响大。解决方法:修剪平均数,去除极端值。2)不能有缺失值。用中数等代替应用原则:1)同质性。2)平均数与个体数值相结合。3)平均数与标准差、方差相结合。中数又称中点数、中位数、中值。数据排序后,中

5、数刚好把数据的数目分成两半。表示:Md或Mdn计算:先将数据排序。数据个数为奇数:中间位置(第位置)的数就是中数。例:有一组数据如下,计算它们的中数:29,30,33,34,36解:Md=332)数据个数为偶数:位于中间的两个数的均值(第和位置数据的均值)就是中数。例:有一组数据如下,计算它们的中数:29,30,33,34,35,36解:Md=33.53)数据中间有数值相等的几个数:将中间重复的数看作连续体,利用中间分数的精确上下限进行插值。例:有一组数据如下,计算它们的中数:12,13,13,14,15,15,15,15,15,16

6、解:12,13,13,14,15,15,15,15,15,16累积百分比中,第一个“15”的位置:40%,最后一个“15”的位置:90%15的精确上下限:14.5,15.5。,15.5–Md=0.8,Md=14.7优点:1)计算简单,容易理解。2)不受极端值影响。缺点:1)没有利用全部数据。2)不灵敏。3)受抽样影响大,不稳定。4)不能进一步代数运算。应用:当观测值中有极端值、缺失值。快速估计数据的集中趋势。众数又称范数、密集数、通常数。在次数分布中出现次数最多的数值。表示:Mo计算:找在次数分布中出现次数最多的数值。例:有一组数据如

7、下,计算它们的众数:34,36,29,33,34,30解:Mo=34优点:1)计算简单,容易理解。2)不受极端值影响。缺点:1)没有利用全部数据。2)不灵敏。3)受抽样影响大,不稳定。4)不能进一步代数运算。应用:1)观测值中有极端值、缺失值。2)快速估计数据的集中趋势。3)数据不同质(命名型数据)。4)检查数据偏态(平均数-众数)。5)出现双峰分布。平均数、中数、众数三者关系:三者在偏态分布中:平均数永远在尾端,中数永远在中间。历年真题已知50个数据Xi(i=1,2,…..50)的平均数为100。若Yi=Xi+10,则Yi的平均数为

8、________;若Zi=10Xi,则Zi的平均数等于________。(浙大,2002)现有一列数据,他们是4、4、5、3、5、5、2.这列数据的平均数、众数和全距依次是(B)(2007,全国统考)A.4,4,2B.4

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。