欢迎来到天天文库
浏览记录
ID:40224219
大小:12.25 MB
页数:115页
时间:2019-07-27
《第2章_系统数学模型及其相互转换》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第2章统计资料的描述(统计数据的描述、统计数据特征描述)第2章统计资料的描述§2.1集中趋势的测度§2.2离散程度的测度§2.3偏态与峰态的测度学习目标1.集中趋势各测度值的计算方法2.集中趋势各测度值的特点及应用场合3.离散程度各测度值的计算方法4.离散程度各测度值的特点及应用场合偏态与峰态的测度方法用Excel计算描述统计量并进行分析数据分布的特征集中趋势(位置)偏态和峰态(形状)离中趋势(分散程度)集中趋势反映了一组资料中各数据所具有的共同趋势,即资料中各数据聚集的位置。通过这种趋势的研究可以了解事物的本质特征,可以掌握事物
2、发展变化的规律。这种趋势在统计学中被称为集中趋势。与集中趋势相反,离中趋势反映的是一组资料中各观测值之间的差异或离散程度。集中趋势和离散程度是数据分布的两个重要特征。除此还需要知道数据分布的形状是否对称、偏斜的程度以及分布的扁平程度。数据分布特征的测度数据特征的测度分布的形状集中趋势离散程度众数中位数均值离散系数方差和标准差峰态四分位差异众比率偏态§2.1集中趋势的测度一.分类数据:众数二.顺序数据:中位数和分位数三.数值型数据:均值四.众数、中位数和均值的比较数据分布特征的测度(本节位置)数据的特征和测度分布的形状集中趋势离散程
3、度众数中位数均值离散系数方差和标准差峰态四分位差异众比率偏态集中趋势(Centraltendency)一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据分类数据:众数众数(mode)一组数据中出现次数最多的变量值不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据众数(不唯一性)无众数原始数据:10591268一个众数原始数据:659855
4、多于一个众数原始数据:252828364242定性变量的众数确定1.定性变量的众数确定根据分类变量和顺序变量的不同取值得到频数分布,确定众数时,只需找出频数出现最多所对应的变量取值即为众数。例:通过观察频数分布表,可以直观看到受教育水平为高中的频数最大。因此对于3000名被调查者受教育水平来说,众数就是高中学历。分类数据的众数(例题分析)不同品牌饮料的频数分布饮料品牌频数比例百分比(%)可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100解:这里的变量为“
5、饮料品牌”,这是个分类变量,不同类型的饮料就是变量值在所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即Mo=可口可乐顺序数据的众数(例题分析)解:这里的数据为顺序数据。变量为“回答类别”甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即Mo=不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510合计300100.0定量变量的众数确定2.定量变量的众
6、数确定对于离散型变量的取值,计算众数时,只需找出出现次数最多的众数组,该组的变量取值即为众数。【例】根据表中35名调查员的有效问卷频数分布资料,确定众数。定量变量的众数确定解:根据表中所示,问卷数为145份所对应的人数是4人,高于其他所有问卷数对应的人数。因此35名调查员有效问卷的众数是145份。对于连续性变量的取值,首先根据组距分组得到频数分布。对于等距分组,对应频数最大的组为众数所在组;对于不等距分组,对应频数密度最大的组为众数组。众数设众数组的频数为,众数前一组的频数为,众数后一组的频数为。假定数据在众数组均匀分布,众数与其
7、相邻两组的频数分布有如下关系:下限公式:上限公式:众数18众数【例】给出的某项调查中30名被访者的月收入水平分组数据,得到累积频数分布表。众数解:首先确定众数组是3000-40000元组,因此因此,30名被访者的月收入水平的众数是3428.6元。众数3.众数的特点众数根据众数组及相邻组的频率分布信息来确定数据中心点位置的。众数是一个位置代表值,它不受数据中极端值的影响。没有利用所有观测值,对原数据信息的代表性也不如均值。众数的实际代表意义只有在数据量足够多,且有明显的集中趋势时,才能体现得最好。否则,不宜用众数代表集中趋势。众数在
8、某些场合具有不可替代的作用。如服装和鞋帽尺码对于生产厂商非常重要,但用均值计算的数据可能是不存在的,生产厂商只有按照服装和鞋帽尺码的众数生产才有意义;众数不仅可以代表数值型变量的集中趋势,还可以代表非数值类型变量的集中趋势。如房地产商关心哪种“格局
此文档下载收益归作者所有