资源描述:
《统计学概念和方法-第3章》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数学与信息科学学院王坤Tel:13987460215Fellowang@hotmail.com第三章数据的表述:图和表统计学概念和方法一旦数据被收集后,我们必须在它们中寻找所包含的信息。虽然我们可以看到数据文件中的数据,但是无法全部理解它们。因此,我们要想办法从数据中提取信息。这就意味着,我们需要通过图、表、和计算来分析数据。统计图是根据统计数字,用几何图形、事物形象和地图等绘制的各种图形。它具有直观、形象、生动、具体等特点。统计图可以使复杂的统计数字简单化、通俗化、形象化,使人一目了然,便于理解和比较。因此,统计图在统计资料整理与分析中占有重要地位,并得到广泛
2、应用。本章要点图:画出数据分类变量:饼图和条形图度量变量:点图和直方图根据数据做图作图:优秀的标准表:改变排列方式可能更合适3.1图:画出数据分析数据的一种方法是把它们画出来。作图的两个目的:帮助研究者从数据中提取信息;把信息传给他人。看图说话:一幅图胜过一千个文字。3.2分类变量:圆饼图和条形图分类变量也称定性数据,变量的观测值(转换为数字后)不能被排序,如性别,婚姻状况,满意度等。圆饼图(piechart)用一个圆及圆内几个扇形的面积来表示数据的频数(频率)分布。每一类数据对应一个扇形,它的中心角等于360o乘以该类变量出现的频率。 特点:(1)用扇形的面积
3、表示部分在总体中所占的百分比。(2)易于显示每组数据相对于总数的大小。例:向50个消费者调查“在可口可乐、苹果汁、橘子汁、百事可乐、杏仁露等5种饮料中,您最喜欢喝的是哪一种饮料?”,得到的结果汇总在下表中。饮料名称可口可乐苹果汁橘子汁百事可乐杏仁露合计频数178771150频率%3416141422100利用Excel软件可以得到以下饼图。条形图条形图是用宽度相同的长方形的高低或长短来表示数据变动特征的图形。接上例,饮料口味调查。竖直条形图横置条形图,可显示多个水平条形统计图的特点:(1)能够使人们一眼看出各个数据的大小。(2)易于比较数据之间的差别。(3)能清
4、楚的表示出数量的多少。3.3度量变量:点图和直方图度量变量也称计量变量,我们可以用某一尺度度量其观测值。例如收入数,年龄,时间,高度等。3.3.1为一个度量变量作图盒形图盒形图也称箱形图(boxgram).主要包含六个数据节点,将一组数据从大到小排列,分别计算出他的上边缘,上四分位数,中位数,下四分位数,下边缘,还有一个异常值。例某班有31名学生,某门课的考试成绩如下:25,45,50,54,55,61,64,68,72,75,75,78,79,81,83,84,84,84,85,86,86,86,87,89,89,89,90,91,91,92,100在R语言中
5、输入:>x<-c(25,45,50,54,55,61,64,68,72,75,75,78,79,81,83,84,84,84,85,86,86,86,87,89,89,89,90,91,91,92,100)>boxplot(x)茎叶图茎叶图(Stem-and-LeafDiagrams)又称“枝叶图”,由统计学家约翰.托奇turkey设计,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。例:下列数据是一个婚姻登记处一
6、周内申请办理结婚证的37个女性的年龄(不一定是初婚)30,27,56,40,30,26,31,24,23,25,29,33,29,22,33,29,46,25;34,19,23,23,44,29,30,25,23,60,25,27,37,24,22,27,31,24,26。从这些数字我们可以得到什么呢?利用R软件,我们可以做出下列茎叶图:1
7、92
8、2233334442
9、55556677799993
10、000113343
11、74
12、044
13、65
14、5
15、66
16、0左边的枝叶表示年龄的第一位数字,右边的枝叶代表年龄的第二位数字,处于该年龄的新娘有几个则列出几个>x<-c(30,
17、27,56,40,30,26,31,24,23,25,29,33,29,22,33,29,46,25,34,19,23,23,44,29,30,25,23,60,25,27,37,24,22,27,31,24,26)>stem(x)Thedecimalpointis1digit(s)totherightofthe
18、1
19、92
20、2233334442
21、55556677799993
22、000113343
23、74
24、044
25、65
26、5
27、66
28、0注:用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随
29、时添加,方便记录与表示。