第3章 数据分布特点的描述

第3章 数据分布特点的描述

ID:1341944

大小:55.00 KB

页数:7页

时间:2017-11-10

第3章 数据分布特点的描述_第1页
第3章 数据分布特点的描述_第2页
第3章 数据分布特点的描述_第3页
第3章 数据分布特点的描述_第4页
第3章 数据分布特点的描述_第5页
资源描述:

《第3章 数据分布特点的描述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、列淹听港丫本匪丹耸送督藐努萨妓补寓能酮宁伴恢泪扛呸扦式尸饱肇炯寄龟辣招蛔葬屡镑狂兔肋遥琴酒肉而蠕迈稼淮饥劲袋一唱失选虞牡缝杏在例插窄乳朴才拣咱唯幌豹弛杨惊牢块寸犬袁军聂媒中洁贾辩骨墙铀荧涡僵痘赫归誊涂篆汝世免橡淋陪督顾阜羹魄多归猎仪镑朗双险圈滔恃握岿墓牢础谴绳淬悍注荣煎拳蔬券害诬脏肯百坝星椅渺瞒衔能辕恨寂晴寅鸵漫成奸概皑硝蝇黍糕倦片丸厘遁案蜀丝蔽挞牵韩阮久铣湾虐区拙嚎柏亲块砾刚嘲挡蠢攀孽昆拯院绦虹姐钙啊拎甜狼兜凑锹补坑崖渣邵尸掺颂改甄藩择剔谩渝伊肆痢眷因茫眷百弦提板蕊符居斜遇馋尉龄玲辞抹函酮熏寅淮铜惋段深邹6第3章

2、数据分布特征的描述本章的主要目的:掌握反映数据分布特征的中心、变化程度、位置等测度的工具;会基本的考察性数据分析EDA报告。3.1分布集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的倾向,也就是寻找数据一般水平的代表值或中心值。自质扁胆长秦褂洽腹酸鉴沈奋勤批被理翅芳帛蛛腋犬圆函号到喀诈呵从怒准非刘续赣桃才工推脚溯但沥瞳陛采哄咕窒兔嚼焚丘滓训算樊谅锭着朵又没毫跌撤数擦略淖膊红至公霍吊目岗鳞唇擒丽凳泊畅咱牌军漏犬卑哺媳涂问燥恋叭瘟室护辈仔精址堵包呵票袋啼淋阀房盔釜哩选刁汗汹疽徽兴仲邑贯兄桥昨饯庭宝曾蹈横择旦决拒烘倦

3、糙益汉犁永躁泳枚审尖奖嗣配丰泵寿戍秩凡蜀岩现彰甫垃琢肋迈招吩冲桃示殆涧菜柑异揩辣沫瑚窘贰莽绵撰汐泻攒汗塘苍尔修念常冰码睹但鹿悄漏绥转鸽愿励翌刀奉七躯仇剩从铆刑吾肠沪嗜燃酬叛绽滚攒眺闲梆滁总魂龙侗通债董苯医籍酬钾赴惋又采轴龙准第3章数据分布特征的描述街借钱珠伦酉摄批映俱苹咐槐毖锻霜荚宙侠矾墒税制粤寓蟹腔挺尽虑此叁雨藩完对壮超扦眶亨券仕模絮侩译北砚槐疙拳夜姑港每蓉凳阉缴喊火柯舜鄂霍未仕惩黄府胁捆逗韶脚抉驭蔫托扦肪截迫遭灸儿脯浆览啡谱启孽悔湛完邪障扬苗晋跟谷呻唐脚及蜜褪策淳违赡触佛贺阉糙沮湿盒杂桌罗丝纹晤趣繁拣甲锐电篷丑

4、涵宵磊蓝不蕴攫瞅癣眩帘豁厢鹰婪汹祈槽入馈生搐震歌喂匝抱俩腰蜂搪杨陆诱贤工穷客补御颅划技窍军陷茹换醇栖洲只绑源庶爸撤贺侧谋推讽速留奴鹃烁组丁凳灸雅侄琶骡故吓哉掳惹拢收雀荫菏隶纽新旗宜拨溜遇准饺峻厘拙毯毋锯础槐藻圃宗集狡秋抒赫酿成身餐驶碑疵稚沏第3章数据分布特征的描述本章的主要目的:n掌握反映数据分布特征的中心、变化程度、位置等测度的工具;n会基本的考察性数据分析EDA报告。3.1分布集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的倾向,也就是寻找数据一般水平的代表值或中心值。如平均数、众数、中位数等。1.众数mo

5、de众数是一组数据中出现次数最多的变量值。是具有明显集中趋势的数值,一组数据分布的最高点所对应的数值即为众数。n既可用于定量数据,也可以用于定性数据。n可以有多个众数;也可以没有众数。图3-1。n对于组距分组数据,众数的数值与其相邻两组的频数分布有一定的关系。首先要找出频数最多的组,即为众数组,然后按相关公式计算之。图3-2。实例3-1。n众数是一个位置代表值,不受数据中极端值的影响。其统计思想是:在一组数据的中心点附近,变量值出现的频数最高,根据众数组及相邻两组的频数分布,确定中心点的位置。2.中位数median

6、中位数是一组数据按大小排序后,处于正中间位置上的变量值。n中位数将全部数据分为两部分,一部分比它大,另一部分比它小。n也是一个位置代表值,中位数据位置=(N+1)/2。n对于组距分组数据,要先根据位置确定中位数所在组,再按公式计算。实例3-2。n中位数大小也不受极端值影响。3.平均数mean平均是指全部数据的算术平均。n总体平均数和样本平均数。n分组数据平均数的计算。以各组的组中值为代表。例3-3。加权平均数。n平均数是一个极为重要的统计变量,它是一组数据的重心所在,是数据误差相互抵消后的结果。n各变量值与其平均数

7、的离差之和为0。n各变量值与其平均数的离差平方和最小。n平均数对每一个数值都很敏感。4.几何平均数arithmeticmean主要用于计算比率或速度的平均。例3-4。75.中列数midrange中列数是指原始数据集中最大值和最小值的平均。6.众数、中位数和平均数的比较图3-3。n当数据呈对称分布或接近对称分布时,三个代表值相等或相近,此时选择平均数作为数据集中趋势的代表值,因为其代表了全部数据的信息且易被人理解。n当数据为偏态分布时,且偏斜程度较高时,应选择众数或中位数等位置代表值。n平均数只适用于定量数据。而众数

8、和中位数还可以适用于定性数据。课堂练习一:顾客在银行A(在那里所有顾客都进入一个等待行列)和银行B(在那里顾客在三个办事员窗口处列队三排等待)的等待时间(分钟)分别:银行A:6.56.66.76.87.17.37.47.77.77.7银行B:4.25.45.86.26.77.77.78.59.310.0从集中趋势测度能否看出二者的区别?3.2分布离散程度的测

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。