欢迎来到天天文库
浏览记录
ID:42326159
大小:29.00 KB
页数:9页
时间:2019-09-12
《第章 数理统计的基本知识》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第1章数理统计的基本知识1第1章数理统计的基本知识第1节统计学统计学是用科学的方法收集、整理、汇总、描述和分析统计数据,在此基础上进行统计推断和决策的方法论科学。统计学分为两大类:?描述统计学?推断统计学一、描述统计学描述统计学是研究对数据的收集、整理、汇总、显示、分析和对数据数量特征描述的方法,称为描述统计学或演绎统计学。描述统计主要包含图形描述和数量特征描述。1、收集数据(直接收集:普查,抽样调查;间接收集:统计报表)统计数据来源于直接或间接的调查和科学实验,常用的调查方法:(1)普查(全面调查):如人口普查(2)
2、抽样调查:从调查对象的总体中抽出一部分作为样本,对样本中包含的对象进行调查,根据样本的数据特征推断总体数量特征。常用的抽样方法:简单随机抽样,系统抽样和分层抽样。①简单随机抽样(a)抽签法(b)随机数法:用随机数表使用简单随机抽样一般要满足以下特点:总体中个体数较少,而且事1先不知道总体的任何信息。②系统抽样:当总体中个体的个数较多时,可将总体均衡分出几部分,定出规则,从每部分抽出1个,每个个体被抽到的可能性仍然相同。比如,从1000个产品中抽取50个,50:1000=1:20,将1000个产品分成20组,每隔20个号
3、抽取1个。步骤:(1)编号;(2)分段(分组),组数k?N,N表示总体中个体n数,n表示抽取个体数;(3)确定起始抽样号;(4)每隔定间距k抽取所有号码。③分层抽样:当已知总体由差别明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按各部分的比例进行抽样,这种抽样叫分层抽样。分成的各部分叫做层。比如,一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁以上的有95人。为了解这个单位职工与身体状况有关的某项指标,从中抽取容量为100的样本。因已知年龄信息,采用
4、分层抽样,抽样人数:总人数=100:500=1:5,所以各层需要抽取的人数应占1的比例,从而1251=25,2801=56,951=19,在5555各层抽取的人可采用简单随机抽样或系统抽样,显然,每人被抽到的可能性相同。简单随机抽样和系统抽样事先不知道总体的任何信息,而分层抽样则充分利用总体的已知信息。(3)统计报表间接收集数据主要是通过国家和地方的统计部门或统计书刊等公2开出版物上查找的数据。如《中国统计年鉴》,也可以从网上查阅。常用的样本数据分为时间序列数据和横截面数据。时间序列数据是按时间的先后顺序排列的数据。如
5、,年国民收入、年粮食产量、月消费额等。横截面数据是在同一时间截面上的数据。如,同一年度鞍钢、宝钢、首钢的钢产量;2014年度不同职业的受过大学教育的人的平均收入(教师、会计、医生、精算师等)。代表性的参考书?中国科技大学研究生院李丛珠<抽样调查>?中国科学院严擎宇<抽样检查方法>2、数据的整理、汇总和显示(1)图形描述:直方图步骤:第一步:将收集的数据按某种规则排序(由小到大或由大到小)第二步:确定组数和组距第三步:数出组频数,计算组频率第四步:计算组频率密度以及累积组频率第五步:做出统计表第六
6、步:作图例1从一批零件中抽出100个,测其重量(单位:g)的一组样本观察值237240240241242242243244244244244244245245245246246246246246324624624724724724724724724724724824824824824924924924924924924924924925025025025025025025025025125125125125125125125225225225225225225225225225225225225325325325325
7、3254254254254254255255255255255255256256256257257258258258259259260263264265试画出频率直方图和累积频率直方图.第一步:排序.最小值x(1)?237,最大值x(100)?265第二步:确定组数和组距.分成10组,组距?=3第三步:数出组频数,计算组频率第四步:计算组频率密度以及累积组频率第五步:做出统计表4第六步:作图频率直方图5累计频率直方图图形还有:茎叶图,箱线图等.参看<统计的思想与方法>(2)数字特征的描述度量集中趋势的量:均
8、值,中位数,众数度量离散程度的量:极差,平均绝对偏差,方差和标准差度量数据分布形状的量:偏度和峰度Ⅰ度量集中趋势的量:均值,中位数,众数①均值:全部数据的算术平均数1n公式:?n?xii?11k分组数据:?n?nixii?1例2计算例1中100个零件的平均重量.6②中位数:一组数据按从小到大排序后,处于中间位置上的数值,称为中位数
此文档下载收益归作者所有