欢迎来到天天文库
浏览记录
ID:16327322
大小:165.00 KB
页数:24页
时间:2018-08-09
《统计数据代表值计算》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第5章统计数据的标志值计算及其描述5.3探索性统计分析前面介绍的统计资料描述方法通常是先将统计资料分组处理,然后把分组资料画成各种图分析其分布规律。但这种传统的统计资料处理方法有一定的局限性,容易失去原始资料的真实性。为了克服这一弊端,70年代开始国外已经出现了新的探索性资料分析方法。探索性资料分析特征操作简便,能够准确地描述统计变量分布情况。在这里只介绍最常用的茎叶图和箱线图。5.3.1箱线图(Boxplot)Q1Q2Q3L0H0平均数╋箱线图是把第一四分位数,第二四分位数(中位数),第三四分位数,四分位数范围,最大值及最小值画成一个箱子和
2、一条线。将箱子两侧超过四分位数差1.5倍范围内的值用点线(--)连接起来,超出四分位数差1.5倍至3倍范围的值为零,超过3倍的特别大或特别小的异常值用*表示。如果我们所研究的统计资料的分布是对称的,那么Q2垂直线将落在箱子的正中央。如果Q2垂直线落在靠近Q3的位置,那么分布的长尾拖向左边;相反Q2垂直线落在靠近Q1的位置,那么分布的长尾拖向右边。因此不同的箱线形状就反映出不同的分布特征(见图5-6)。Q1Q2Q3(B)右偏分布Q1Q2Q3(A)正态分布Q1Q2Q3(C)左偏分布图5-6箱线图与分布形状945.3.2茎叶图(Stem-and-l
3、eafDisplay)茎叶图将提供统计资料的分布形态、范围、集中程度等情报。利用茎叶图主要有两个优点,首先它既能保留原始资料的真实情报,又能为准确计算平均数等代表值提供方便。特别是对100个以下观测值的频数分布分析非常有用。其次SASforWindows在统计量的分组中,茎叶图可将统计分组和画直方图一次完成,不会出现重复分组的可能。茎叶图将树茎置于垂直线的左侧,树叶在垂直线的右侧按顺序排列。绘制茎叶图,关键是要设计好树茎,这好比和资料分组时,先确定分组数和每组的组限一样重要。茎叶图是以观测值的间隔为纵坐标(茎),观测值的末尾数字为横坐标(叶)
4、,叶的右边数字为相应区间内观测值的个数。观测值的间隔为系统自动给出,当观测值的个数小于30时,数据间隔为10,当大于30时,间隔为5。StemLeaf#91184171253613568965255844567335194221----+----+----+----+MultiplyStem.Leafby10**+15.4利用SAS程序计算描述性统计量5.4.1PROCUNIVARIATE前面我们叙述了平均数、中位数、众数、偏度系数、方差、标准差等代表分布集中趋势和离散趋势的标志值和箱线图及茎叶图等探索性资料分析。下面将介绍利用SASforW
5、indows,计算和分析描述性统计量12)把描述性统计量也称作基础统计量.)的基本方法(SAS程序),SASforWindows统计分析的基本形式如下:①PROCUNIVARIATEOPTION1;②VAR变量名1变量名2…变量名n;③BY变量名1变量名2…变量名n;④FREQ变量名;⑤WEIGHT变量名;⑥OUTPUTOUT=dsnoption2;□PROGRAM解释①PROCUNIVARIATE;SASforWindows统计分析PROCUNIVARIATE命令是最常用的命令,也是最重要的命令之一,用来分析各种各样的描述性统计量。PROC
6、UNIVARIATE命令不仅具有统计量分析功能,还具有打印功能等。option1-DATA=dsn:指定分析资料名dsn。94-PLOT:探索性分析,作茎叶图和箱线图。在SASforWindows,根据观测值个数的多少,茎叶图和箱线图的形状有所不同。下面的图(a)是观测值个数n=30的情况,图(b)是观测值个数n=32的情况。由此可知,当观测值的个数n30时,茎叶图的同一个级别的树茎不分杈,当n>30时,茎叶图的同一个水准的树茎分杈,比如70级别的树茎,分成70~74和75~79级别的两个树茎,这等于把原来的茎叶图和箱线图拉长了一倍。图(a)
7、观测值n≤30图(b)观测值n>30StemLeaf#BoxplotStemLeaf#Boxplot951
8、95673
9、(右)802334567+-----+9
10、71223455678811*-----*8562
11、6352
12、+
13、8223345+-----+513694+-----+75567886
14、
15、40463
16、7122345*--+--*391
17、651
18、
19、221
20、631
21、
22、----+----+----+----+5692+-----+MultiplyStem.Leafby10**+15132
23、461
24、4042
25、391
26、3
27、2
28、94221
29、(
30、左)----+----+----+----+MultiplyStem.Leafby10**+1(图5-7)茎叶图和箱线图与观测值-FREQ:作频数分析表(频数也称作
此文档下载收益归作者所有