欢迎来到天天文库
浏览记录
ID:82327688
大小:372.00 KB
页数:67页
时间:2024-08-29
《(03)第3章-用统计量描述数据1资料.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
第3章数据的概括性度量3.1集中趋势的度量3.2离散程度的度量3.3偏态与峰态的度量 3.1集中趋势的度量3.1.1平均数3.1.2中位数和分位数3.1.3各度量值的比较第3章数据的概括性度量 集中趋势包括均值、中位数和分位数、众数3.1集中趋势的度量 平均数——均值总体平均数——;样本平均数——x 简洁平均数(Simplemean)设一组数据为:x1,x2,…,xn 某公司的8名职工的月工资如下:(单位:元) 加权均值设一组数据为:x1,x2,…,xk相应的频数为:f1,f2,…,fk 分组平均数(Weightedmean)设各组的组中值为:M1,M2,…,Mk相应的频数为:f1,f2,…,fk分组平均数 3.1.2中位数和四分位数3.1集中趋势的度量 中位数(median)排序后处于中间位置上的值。不受极端值影响2.位置确定 【例】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789Me=1080 【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:12345678910 某公司的8职工的月工资如下:(单位:元) 四分位数排序后处于25%和75%位置上的值不受极端值的影响QLMeQU25%25%25%25% 四分位数的计算(位置的确定)方法2:spss算法方法1:定义算法 【例】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789 众数(mode)一组数据中出现次数最多的变量值适合于数据量较多时运用不受极端值的影响一组数据可能没有众数或有几个众数 众数、中位数和平均数的关系对称分布均值=中位数=众数 众数、中位数和平均数的关系左偏分布均值中位数众数 众数、中位数和平均数的关系右偏分布众数中位数均值 一家汽车零售店的10名销售人员5月份销售汽车的数量(单位:辆)排序后如下:2、4、7、10、10、10、12、12、14、15 3.2离散程度的度量3.2.1极差和四分位差3.2.2平均差3.2.3方差和标准差3.2.4离散系数:比较几组数据的离散程度第3章数据的概括性度量 离中趋势反映各变量值远离其中心值的程度(离散程度) 极差(range)一组数据的最大值与最小值之差 四分位差(quartiledeviation)也称为内距或四分间距上四分位数与下四分位数之差:Qd=QU–QL25%75% 平均差各变量值与其平均数离差确定值的平均数能全面反映一组数据的离散程度3.计算公式为未分组数据组距分组数据 平均差(例题分析)含义:每一天的销售量平均数相比,平均相差17台 3.2.3方差和标准差3.2离散程度的度量 方差和标准差(varianceandstandarddeviation)数据离散程度的最常用测度值反映各变量值与均值的平均差异 样本方差和标准差(samplevarianceandstandarddeviation)未分组数据未分组数据方差的计算公式标准差的计算公式 样本方差和标准差组距分组数据组距分组数据方差的计算公式标准差的计算公式 某公司的8职工的月工资如下:(单位:元) 含义:每一天的销售量与平均数相比,平均相差21.58台解: 标准分数计算公式对某一个值在一组数据中相对位置的度量可用于推断一组数据是否有离群点4.可使一组数据变为均值为0,方差为1的值 标准分数25283134374043-1.5-1-0.500.511.5 例如:某中学高(1)班期末考试,已知语文期末考试的全班平均分为73分,标准差为7分,甲得了78分;数学期末考试的全班平均分为80分,标准差为6.5分,甲得了83分。甲哪一门考试成果比较好? 阅历法则阅历法则表明:当一组数据对称分布时约有68%的数据在平均数加减1个标准差的范围之内约有95%的数据在平均数加减2个标准差的范围之内约有99%的数据在平均数加减3个标准差的范围之内离群点:在平均数加减3个标准差之外的数。 例:一项关于高校生体重状况的探讨发觉,男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。(1)粗略地估计一下,男生中有百分之几的人体重在55~65kg之间。(2)粗略地估计一下,女生中有百分之几的人体重在40~60kg之间。 例:一条生产线平均每天的产量为3700件,标准差50件。假如某一天的产量低于或高于平均产量,并落入正负两个标准差的范围之外,就认为该生产线失去了限制。下面是一周各天的产量,该生产线哪几天失去了限制? 切比雪夫不等式对于随意分布形态的数据,依据切比雪夫不等式,至少有(1-1/k2)的数据落在均值加减k个标准差之内。其中k是大于1的随意值,但不确定是整数 切比雪夫不等式对于k=2,3,4,该不等式的含义是至少有75%的数据落在平均数加减2个标准差的范围之内至少有89%的数据落在平均数加减3个标准差的范围之内至少有94%的数据落在平均数加减4个标准差的范围之内 离散系数(coefficientofvariation)标准差与其相应的均值之比2.比较几组数据的离散程度3.消退了数据水平凹凸和计量单位的影响 【例3.9】评价哪名运动员的发挥更稳定 【例】一项关于高校生体重状况的探讨发觉,男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。(1)是男生体重差异大还是女生体重差异大?为什么? 3.3偏态与峰态的度量3.3.1偏态及其测度3.3.2峰态及其测度第3章数据的概括性度量 数据分布的形态—偏态与峰态扁平分布尖峰分布偏态峰态左偏分布右偏分布与标准正态分布比较! 3.3.1偏态及其测度3.3偏态与峰态的度量 偏态(skewness)统计学家Pearson于1895年首次提出数据分布偏斜程度的测度计算公式 偏态(skewness)1.偏态系数=0为对称分布2.偏态系数>0为右偏分布3.偏态系数<0为左偏分布偏态系数大于1或小于-1,被称为高度偏态分布;偏态系数在0.5~1或-1~-0.5之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低 图形描述:25201510530220230240频数(天)某电脑公司销售量分布的直方图180200210190170160140150 偏态系数(coefficientofskewness)依据原始数据计算依据分组数据计算 偏态系数(例题分析) 偏态系数(例题分析)结论:偏态系数为正值,但与0的差异不大,说明电脑销售量为略微右偏分布,即销售量较少的天数占据多数,而销售量较多的天数则占少数 3.3.2峰态及其测度3.3偏态与峰态的度量 峰态(kurtosis)统计学家Pearson于1905年首次提出数据分布扁平程度的测度峰态系数=0扁平峰度适中峰态系数<0为扁平分布峰态系数>0为尖峰分布 峰态系数(coefficientofkurtosis)依据原始数据计算依据分组数据计算统计函数—KURTExcel 峰态系数(例题分析)结论:偏态系数为负值,但与0的差异不大,说明电脑销售量为略微扁平分布 Excel中的统计函数MODE—计算众数MEDIAN—计算中位数QUARTILE—计算四分位数AVERAGE—计算平均数HARMEAN—计算简洁调和平均数GEOMEAN—计算几何平均数AVEDEV—计算平均差STDEV—计算样本标准差STDEVP—计算总体标准差SKEW—计算偏态系数KURT—计算峰态系数TRIMMEAN—计算切尾均值 用Excel计算描述统计量Excel【工具】【数据分析】【描述统计】【确定】【输入区域】【输出选项】【汇总统计】【确定】ExcelExcel 用Excel计算描述统计量Excel输出的描述统计量 数据的描述统计量数据特征集中趋势离散程度偏态与峰态中位数和分位数众数极差和四分位差偏态系数方差或标准差峰态系数平均数离散系数 本章小结度量集中趋势的统计量度量离散程度的统计量度量偏态与峰态的统计量各统计量的的特点及应用场合用Excel计算描述统计量 结束THANKS
此文档下载收益归作者所有
举报原因
联系方式
详细说明
内容无法转码请点击此处