欢迎来到天天文库
浏览记录
ID:24833243
大小:4.17 MB
页数:106页
时间:2018-11-16
《《统计数据的描述》ppt课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、2021/10/31第三章数据分布特征的描述3.1集中趋势的度量3.2离散程度的度量3.3偏态与峰态的度量2021/10/323.1.1什么是集中趋势(centraltendency)一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值注意:低层次数据的测度方法也适用于高层次的数据,但高层次数据的测度方法往往不适用于低层次的数据。2021/10/333.1.2分类数据---众数一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影
2、响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据2021/10/34众数(不惟一性)无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:2528283642425有时众数是一个合适的代表值比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。2021/10/361、分类数据的众数(例题分析)不同品牌饮料的频数分布饮料品牌频数比例百分比(%)可口可乐旭日升冰茶百事可乐汇源果汁露露15119
3、690.300.220.180.120.183022181218合计501100解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即Mo=可口可乐2021/10/372、顺序数据的众数(例题分析)解:这里的数据为顺序数据。变量为“回答类别”甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即Mo=不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市
4、户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510合计300100.02021/10/383、数值型数据的众数1)单变量值分组数据某年级83名女生身高资料身高人数(CM)(人)152115421552156415711582159216012161716281634身高人数(CM)(人)1643165816651673168716911705171217231741总计83STAT2021/10/392)组距分组数据众数的计算公式2021/10/310GEFD
5、CABfXf3f2f1dLUM0Δ1Δ2众数的计算公式可以从几何图形得到证明:2021/10/311身高人数比重(CM)(人)(%)150-15533.61155-1601113.25160-1653440.96165-1702428.92170以上1113.25总计83100某年级83名女生身高资料组距分组数据的众数STAT2021/10/3123.1.3顺序数据---中位数和分位数1、顺序数据----中位数排序后处于中间位置上的值Me50%50%不受极端值的影响主要用于顺序数据,也可用数值型数据,但
6、不能用于分类数据各变量值与中位数的离差绝对值之和最小,即2021/10/313中位数(位置的确定)未分组数据:分组数据:2021/10/314①顺序数据的中位数(例题分析)解:中位数的位置为300/2=150从累计频数看,中位数在“一般”这一组别中中位数为Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—2021/10/315②未分组数值型数据的中位数(奇数个数据的算例)【例】9个家庭
7、的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位数10802021/10/316未分组数值型数据的中位数(偶数个数据的算例)【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:123456789102021/10/317③组距分组数据中位数的计算公式2021/10/318(组距分组)共个单位共个单
8、位共个单位共个单位L中位数组组距为d共个单位假定该组内的单位呈均匀分布中位数下限公式为该段长度应为U2021/10/319身高人数累计(CM)(人)人数150-15533155-1601114160-1653448165-1702472170以上1183总计83某年级83名女生身高资料STAT组距分组数据的中位数20如果统计资料中含有异常的或极端的数据,就有可能得到非典型的甚至可能产生误导的平均数,这时使用中位数来度量集中趋势比较合适。比如
此文档下载收益归作者所有