统计学:从数据到结论人大吴喜之老师课件03数据的描述

统计学:从数据到结论人大吴喜之老师课件03数据的描述

ID:37430064

大小:340.10 KB

页数:38页

时间:2019-05-12

统计学:从数据到结论人大吴喜之老师课件03数据的描述_第1页
统计学:从数据到结论人大吴喜之老师课件03数据的描述_第2页
统计学:从数据到结论人大吴喜之老师课件03数据的描述_第3页
统计学:从数据到结论人大吴喜之老师课件03数据的描述_第4页
统计学:从数据到结论人大吴喜之老师课件03数据的描述_第5页
资源描述:

《统计学:从数据到结论人大吴喜之老师课件03数据的描述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、统计学─从数据到结论第三章数据的描述在对数据进行深入加工之前,总应该对数据有所印象。可以借助于图形和简单的运算,来了解数据的一些特征。由于数据是从总体中产生的,其特征也反映了总体的特征。对数据的描述也是对其总体的一个近似的描述。§3.1如何用图来表示数据?§3.1.1定量变量的图表示:1.直方图对于一个定量变量,比如某个地区(地区1)测量了163个高三男生的身高(S3height1.txt)。用图形来表示这个数据,使人们能够看出这个数据的大体分布或“形状”的一个办法是画直方图(histogram)。图3.1就是利用这个数

2、据由SPSS软件所画的直方图。该图的横坐标是身高区间,这里每一格代表5cm的身高范围(格子宽度因不同的数据性质或要求而定,这里的格子宽度为5cm),而纵坐标为各种身高区间的身高的频数。直方图§3.1.1定量变量的图表示:2.盒型图简单一些的是盒形图(boxplot,又称箱图、箱线图、盒子图)。图3.2的左边一个是根据地区1高三男生的身高数据所绘的盒形图;其右边的图代表另一个地区(地区2)的高三学生的身高(height.txt,height.sav,第三章例.xls)。盒型图盒子的中间横线是数据的中位数(median),封

3、闭盒子的上下两横线(边)为上下四分位数(点);按照SPSS的默认选项,如果所有样本中的数目都在离四分位点1.5倍盒子长度之内,则线的端点为最大和最小值,否则线长就是1.5倍的盒子长度(盒子长度称为四分位间距),在其外面的度量单独点出§3.1.1定量变量的图表示:3.茎叶图在直方图和盒形图中,很难恢复数据的原貌。而另一种图:茎叶图(stem-and-leafplots)可以恢复数据以地区1高三男生身高为例(图3.3),茎叶图既展示了分布形状又有原始数据。它象一片带有茎的叶子。茎为较大位数的数字,叶为较小位数的数字。茎叶图其

4、中茎叶图中茎的单位为10cm,而叶子单位为1cm。比如,由于第一行茎为150cm,因此叶子中的九个数字001223344代表九个数目150、150、151、152、152、153、153、154、154cm等。每行左边有一个频数(比如第一行有9个数目,第二行有17个等等);可以看出最长的一行为从165cm到169cm的一段(有35个数)。§3.1.1定量变量的图表示:4.散点图数据会有两个变量,如美国男士和女士初婚年限数据(marriage.txt)。该数据描述了自1900年到1998年男女第一次婚姻延续的时间。这里年份

5、是一个变量,婚姻延续时间是第二个变量。由于不可能将所有人的婚姻年限都给出来,所以每年就取了一个中间的值(中位数)作为代表。散点图§3.1.2定性变量的图表示:饼图定性变量(或属性变量,分类变量)不能点出直方图、散点图或茎叶图,但可以描绘出它们各类的比例。下面用SPSS绘的图3.5(饼图,piechart)表示了说世界各种主要语言人数的比例(language.txt).饼图§3.1.2定性变量的图表示:条形图而用同样数据画的图3.6称为条形图(barchart)。从每一条可以看出讲各种语言的实际人数,而且分别给出了每个语种

6、中母语和日常使用的人数(在图中并排放置)。条形图显示比例不如饼图直观。条形图§3.2如何用少量数字来概括数据?大量的数字既繁琐又不直观;需要对数据做人们时间和耐心所允许的简化我们可以用“平均”,“差距”或百分比等来概括大量数字。由于定性变量主要是计数,比较简单,常用的概括就是比例或百分比。下面主要介绍关于定量变量的数字描述。§3.2如何用少量数字来概括数据?可用少量所谓汇总统计量或概括统计量(summarystatistic)来描述定量变量的数据。这些数字是从样本数据得来的,因而也是样本的函数,任何样本的函数,只要不包含

7、总体的未知参数,都称为统计量(statistic)。样本的随机性决定统计量的随机性(统计量也是随机变量)§3.2如何用少量数字来概括数据?概括统计量经常对应于总体的无法观测到的某些参数。这时,统计量可作为这些参数的估计。一些统计量还可以用来检验样本和假设的总体是否一致。§3.2如何用少量数字来概括数据?注:一些统计量前面有时加上“样本”二字,以区别于总体的同名参数。如“样本均值”和“样本标准差”,以区别于总体均值和总体标准差;但在不会混淆时可以只说“均值”和“标准差”。§3.2.1数据的“位置”数据有位置吗?这里三个数据

8、的位置一样吗?§3.2.1数据的“位置”“位置”一般是关于数据中某变量观测值的“中心位置”或者数据分布的中心(center或centertendency)。和这种“位置”有关的统计量就称为位置统计量(locationstatistic)。位置统计量当然不一定都是描述“中心”了,比如后面要讲的k百分位数(或k%分位数)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。