lec5 数据集中趋势的描述

lec5 数据集中趋势的描述

ID:38567050

大小:350.43 KB

页数:32页

时间:2019-06-15

lec5 数据集中趋势的描述_第1页
lec5 数据集中趋势的描述_第2页
lec5 数据集中趋势的描述_第3页
lec5 数据集中趋势的描述_第4页
lec5 数据集中趋势的描述_第5页
资源描述:

《lec5 数据集中趋势的描述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据集中趋势的描述第五讲大纲集中趋势的计量集中趋势反映一组资料中各数据所具有的共同趋势,即资料中各数据聚集的位置算术平均数中位数众数集中趋势的其他度量分位数截尾平均数几何平均数调和平均数算术平均数(Mean)算术平均数也称均值,是数据集中趋势的最主要测度量设一组资料有n个数值,x1,x2,…,xn,令代表其算术平均数,则:算术平均数的性质一组资料中,各项数值与其均值之差(称为离差)的代数和为零算术平均数的性质一组资料中,各数据与均值离差的平方和为最小,即含义:用平均数来猜测所有的数值,所产生的误差最小为第i组次数比重或权数算术平均数的性质若有k组资料,各组的均值和项数分别为,则

2、将k组资料合并的项数为f,总平均数为,则有:加权算术平均数如果是根据分组资料计算算术平均数,由于分组资料中每个数值出现的次数不同,就要用次数做权数,计算加权算术平均数例:经济学院01级本科生的使用手机的品牌情况(假设原始资料丢失)在Excel中计算加权算术平均数要用到Sumproduct函数求学生所使用的手机平均价格手机品牌使用人数比重%平均价格摩托罗拉4334.41589.07诺基亚2318.41863.48其他3124.81602.23三星1612.82073.75西门子129.61310.00总计125100--算术平均数的作用与局限是一组数据的重心,是同质总体数量特征一

3、般水平的代表值,适用于次数对称分布的资料适合代数运算其数值容易受极大值或极小值的影响,当一组资料存在极端值时,均值的代表性就会受很大影响,这种情况统计上称为不稳健用EXECEL求算术平均数简单算术平均数average函数加权算术平均数运用sumproduct函数和sum函数中位数(Median)中位数的定义与计算设一组资料有n个数值:x1,x2,…,xn,若按大小顺序排列,处在数列的中点位置的数值,就是中位数中位数将全体数据分成项数相等的两部分,因此,也是数据集中趋势的一个很好的测度值用Excel中的Median函数求中位数中位数的性质中数位于依序排列资料的中间位置,是位置平均

4、数,不易受极端值的影响,当次数分配非对称,或资料存在极端值时,中位数作为集中趋势的度量较好,是较稳健的集中趋势测度量指标对于具有偏态分布的数据,中位数的代表性要比均值好中位数的不足之处在于它的确定只与中间位置的一、两个数值有关,忽略了其它数值的大小,缺乏敏感性,并且不适合代数运算中位数的代表性不易计算数值平均数时,可用中位数代表总体的一般水平,尤其是在总体标志值差异很大的情况下,中位数更加具有较强的代表性例如人口年龄中位数,可表示人口年龄的一般水平集贸市场上某种商品的价格中位数,可代表该种商品价格的一般水平在收入水平差异较大的社会,用居民收入的中位数作为收入水平的代表值更为恰当

5、,因为它排除了极端变量值的影响中位投票者定理MedianVoterTheorem公共选择理论中著名定理什么是中位投票者?如果把全体选民的偏好进行排序,其偏好位于全体选民偏好中间位置的投票者称为中位投票者,有时又称中间投票人,中位选民。例如:每位同学愿意缴纳的班费从1元到20元不等,其中8元为中位数,愿意缴纳8元的同学为中位投票者中位投票者定理在多数票通过规则的条件下,那么在一对一的选举中,获胜者(可以是候选人,也可以是公共决策)就是赢得中位投票者支持的最佳选择换言之,中位投票者决定了投票结果前提假设每个人的偏好都是单峰型的所谓单峰型就是说在给定的备选方案排序中,个人认为最好的方

6、案只有一个讨论如果班长让同学们在5元和8元之间进行投票,哪一个选项会得到多数支持?在12元和8元之间呢?在9元和15元之间呢?先看一下5元和8元之间的投票每个同学会把选票投给最接近自己意愿的选项愿意缴纳8元以上班费的同学会选择8元,这部分同学就占到一半;低于5元的同学会选择5元;而缴纳意愿在5元至8元之间的同学,低于6.5元的会选择5元,高于6.5元的会选择8元8元就获得了多数选票我们看到,中位投票者的意愿总会得到一半以上选民的支持众数(Mode)众数是一组资料中出现次数最多的那个数值,因此也可以代表数据的集中趋势众数可能不存在或不止一个实例:市场上最普遍的成交价格可以真实反映

7、某种商品的价格水平“流行****”:人群中出现次数最多的****用众数来表现给定总体的一般水平或变量数列的集中趋势具有非常直观的代表意义众数的特点不易受极端值的影响,缺乏敏感性,不适合代数运算当数据的分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性比均值要好其缺点是具有不唯一性,对于一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数适合于资料中有较多的数值集中于某一数值的情况,以及按品质标志分组的资料可用Excel中的Mode函数求众数均值、中位数、众数三者之间关系在密

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。