欢迎来到天天文库
浏览记录
ID:25761928
大小:518.50 KB
页数:13页
时间:2018-11-22
《数据的统计描述和分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第十章数据的统计描述和分析数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计是以概率论为基础的一门应用学科。数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息的数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的基础,实用性较强,在统计工作中经常使用。面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计的最基本方法。我们将用Matlab的统计工具箱(StatisticsToolbox)来实现数据的统计描述和分析。§1统计的基本概念1.
2、1总体和样本总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及废品分类),学校全体学生的身高。总体中的每一个基本单位称为个体,个体的特征用一个变量(如)来表示,如一件产品是合格品记,是废品记;一个身高170(cm)的学生记。从总体中随机产生的若干个个体的集合称为样本,或子样,如件产品,100名学生的身高,或者一根轴直径的10次测量。实际上这就是从总体中随机取得的一批数据,不妨记作,称为样本容量。简单地说,统计的任务是由样本推断总体。1.2频数表和直方图一组数据(样本)往往是杂乱无章的,作出它的频数表和直方图,可以看作是对这组数据的一个初步整理和直观描述。将数据的取值范
3、围划分为若干个区间,然后统计这组数据在每个区间中出现的次数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一个阶梯形的图,称为直方图,或频数分布图。若样本容量不大,能够手工作出频数表和直方图,当样本容量较大时则可以借助Matlab这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。例1学生的身高和体重学校随机抽取100名学生,测量他们的身高和体重,所得数据如表身高体重身高体重身高体重身高体重身高体重1727517162166621605515557173581665517063167531736017860173731695516867168651756
4、71766416850161491696317161178641776617058169641655216459173741726916952173571736116670163571705616065171651696217058172641695816772175761645916663169541675417962167471686516564168571765717057158511656217253169661695817250-133-163471656617060163501725718263171591776417367172591706217259177581766817
5、56818470165581776616963176601776717256165561664917663182691867716676169721735916965171711625217575174661676316650174641686217059(i)数据输入数据输入通常有两种方法,一种是在交互环境中直接输入,如果在统计中数据量比较大,这样作不太方便;另一种办法是先把数据写入一个纯文本数据文件data.txt中,格式如例1的表格,有20行、10列,数据列之间用空格键或Tab键分割,该数据文件data.txt存放在matlabwork子目录下,在Matlab中用load命令读入数
6、据,具体作法是:loaddata.txt这样在内存中建立了一个变量data,它是一个包含有个数据的矩阵。为了得到我们需要的100个身高和体重各为一列的矩阵,应做如下的改变:high=data(:,1:2:9);high=high(:)weight=data(:,2:2:10);weight=weight(:)(ii)作频数表及直方图用hist命令实现,其用法是:[N,X]=hist(Y,M)数组(行、列均可)Y的频数表。它将区间[min(Y),max(Y)]等分为M份(缺省时M设定为10),N返回M个小区间的频数,X返回M个小区间的中点。hist(Y,M)数组Y的直方图。对于例1的数据,编
7、写程序如下:loaddata.txt;high=data(:,1:2:9);high=high(:);weight=data(:,2:2:10);weight=weight(:);[n1,x1]=hist(high)%下面语句与hist命令等价%n1=[length(find(high<158.1)),...%length(find(high>=158.1&high<161.2)),...%length(find(hig
此文档下载收益归作者所有