欢迎来到天天文库
浏览记录
ID:46690332
大小:389.50 KB
页数:46页
时间:2019-11-26
《数据的概括性度量》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第3章数据的概括性度量集中趋势的度量离散程度的度量偏态与峰态的度量数据分布的特征3.1集中趋势(centraltendency)一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据集中趋势(centraltendency)3.1.1分类数据:众数3.1.2顺序数据:中位数和分位数3.1.3数值型数据:平均数3.1.4众数、中位数和平均数的比较3.1.
2、1众数(mode)一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据众数(不惟一性)无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242分类数据的众数(例题分析)饮料品牌频数比例百分比(%)可口可乐150.3030旭日升冰茶110.2222百事可乐90.1818汇源果汁60.1212露露90.1818合计501100解:这里的变量为“饮料品牌”,这
3、是个分类变量,不同类型的饮料就是变量值所调查的50人中,购买可口可乐的人数最多,为15人,占被调查总人数的30%,因此众数为“可口可乐”这一品牌,即Mo=可口可乐3.1.2中位数(median)和分位数一、中位数(median)排序后处于中间位置上的值不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据各变量值与中位数的离差绝对值之和最小,即Me50%50%中位数(位置和数值的确定)位置确定数值确定顺序数据的中位数(例题分析)甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(
4、户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—解:中位数的位置为(300+1)/2=150.5从累计频数看,中位数在“一般”这一组别中中位数为Me=一般数值型数据的中位数(9个数据的算例)【例】9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位数1080数值型数据的中位数(10个数据的算例)
5、【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:12345678910二、四分位数(quartile)★排序后处于25%和75%位置上的值不受极端值的影响主要用于顺序数据,也可用于数值型数据,但不能用于分类数据四分位数(位置的确定)定义算法四分位数(9个数据的算例)【例】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:750780850960108012501500163
6、02000位置:1234567893.1.3、平均数㈠算术平均数1、简单平均数(Simplemean)设一组数据为:x1,x2,…,xn(总体数据xN)样本平均数总体平均数2、加权平均数(Weightedmean)设各组的组中值为:M1,M2,…,Mk相应的频数为:f1,f2,…,fk样本加权平均总体加权平均平均数(数学性质)1.各变量值与平均数的离差之和等于零2.各变量值与平均数的离差平方和最小证明见P18㈡、几何平均数(geometricmean)n个变量值乘积的n次方根适用于对比率数据的
7、平均主要用于计算平均增长率计算公式为5.可看作是平均数的一种变形几何平均数(例题分析)【例】某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。求各年的年平均增长率年平均增长率=114.91%-1=14.91%3.1.4众数、中位数和平均数的比较众数、中位数和平均数的关系众数、中位数、平均数的特点和应用众数不受极端值影响具有不惟一性数据分布偏斜程度较大且有明显峰值时应用中位数不受
8、极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用3.2离散程度的度量3.2.1分类数据:异众比率3.2.2顺序数据:四分位差3.2.3数值型数据:方差和标准差3.2.4相对离散程度:离散系数离中趋势数据分布的另一个重要特征反映各变量值远离其中心值的程度(离散程度)从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值3.2.1异众比率(variationratio)1.对分类数据离散程度的测度2.非众数组的
此文档下载收益归作者所有