欢迎来到天天文库
浏览记录
ID:49860336
大小:2.00 MB
页数:78页
时间:2020-03-03
《统计学第一章数据的图表展示.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第3章数据的图表展示PowerPoint统计学第3章数据的图表展示3.1数据的预处理3.2品质数据的整理与显示3.3数值型数据的整理与显示3.4合理使用图表学习目标了解数据预处理的内容和目的掌握分类和顺序数据的整理与显示方法掌握数值型数据的整理与显示方法用Excel作频数分布表和图形合理使用图表3.1数据的预处理3.1.1数据审核3.1.2数据筛选3.1.3数据排序3.1.4数据透视表数据的预处理数据审核检查数据中的错误数据筛选找出符合条件的数据数据排序升序和降序寻找数据的基本特征数据透视按需要汇总数据审核数据审核—原始数据(rawdata)完整性审核应调查的单位或个体是否有遗漏所有的调查项目
2、或变量是否填写齐全准确性审核数据是否真实反映实际情况,内容是否符合实际数据是否有错误,计算是否正确等数据的审核—二手数据(secondhanddata)适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定数据是否符合自己分析研究的需要时效性审核尽可能使用最新的数据确认是否有必要做进一步的加工整理数据筛选与排序数据筛选(datafilter)当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选数据筛选的内容将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除用Excel进行数据筛选8名学生
3、的考试成绩数据数据筛选(datafilter)数据排序(datarank)按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索排序有助于对数据检查纠错,以及为重新归类或分组等提供依据在某些场合,排序本身就是分析的目的之一排序可借助于计算机完成数据排序(方法)分类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分数值型数据的排序递增排序:设一组数据为x1,x2,…,xn,递增排序后可表示为:x(1)x(2)>…>x(n)数据透视表数据透
4、视表(pivottable)可以从复杂的数据中提取有用的信息可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图形成一个符合需要的交叉表(列联表)在利用数据透视表时,数据源表中的首行必须有列标题数据透视表(用Excel创建数据透视表)第1步:在Excel工作表中建立数据清单第2步:选中数据清单中的任意单元格,并选择【数据】菜单中的【数据透视表和数据透视图】第3步:确定数据源区域第4步:在【向导—3步骤之3】中选择数据透视表的输出位置。然后选择【布局】第5步:在【向导—布局】对话框中,依次将”分类变量“拖至左边的“行”区域,上边的“列”区域,将需要汇总的“变量”拖至“数据区域”第6步:然
5、后单击【确定】,自动返回【向导—3步骤之3】对话框。然后单击【完成】,即可输出数据透视表3.2品质数据的整理与展示3.2.1分类数据的整理与图示3.2.2顺序数据的整理与图示数据的整理与显示(基本问题)要弄清所面对的数据类型不同类型的数据,采取不同的处理方式和方法对分类数据和顺序数据主要是作分类整理对数值型数据则主要是作分组整理适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据分类数据的整理与图示分类数据的整理(基本过程)1.列出各类别2.计算各类别的频数3.制作频数分布表4.用图形显示数据分类频数比例百分比比率A
6、BCDE分类数据的整理(可计算的统计量)频数(frequency):落在各类别中的数据个数比例(proportion):某一类别数据个数占全部数据个数的比值百分比(percentage):将对比的基数作为100而计算的比值比率(ratio):不同类别数值个数的比值分类数据整理—频数分布表(例题分析)【例】一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次。右边就是记录的原始数据用Excel制作频数分布表绿色健康饮品分类数据的图示—条形图(barChar
7、t)用宽度相同的条形的高度或长短来表示各类别数据的图形有单式条形图、复式条形图等形式主要用于反映分类数据的频数分布绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图(columnchart)分类数据的图示—条形图(例题分析)分类数据的图示—对比条形图(side-by-sidebarchart)分类变量在不同时间或不同空间上有多个取值对比分类变量的取值在不同时间或不同空间上的差异或变
此文档下载收益归作者所有