1.1.总体与样本

1.1.总体与样本

ID:40817249

大小:2.11 MB

页数:67页

时间:2019-08-08

1.1.总体与样本_第1页
1.1.总体与样本_第2页
1.1.总体与样本_第3页
1.1.总体与样本_第4页
1.1.总体与样本_第5页
资源描述:

《1.1.总体与样本》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、本章转入课程的第二部分数理统计数理统计的特点是应用面广,分支较多.如生物统计、金融统计和医学统计等.由于学时有限,课程的这部分内容重点在于介绍数理统计的一些重要概念和典型的统计方法,它们是实际中最常用的知识.数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析.由于大量随机现象必然呈现出它的规律性,因而从理论上讲,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来

2、.只允许我们对随机现象进行次数不多的观察试验,也就是说,我们获得的只是局部观察资料.但客观上数理统计的任务就是研究怎样有效地收集、整理、分析所获得的有限的资料,对所研究的问题,尽可能地作出精确而可靠的结论.在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.因为抽样的结果带有随机性,不能不把它当作随机现象来处理.可见,在数理统计中必然要用到概率论的理论和方法.下面我们以一例进行说明:1.总体和样本一、总体和样本例某钢铁厂某天生产10000根钢筋,规定强度小于52kg/mm^2的算作次品,如何来求这批钢

3、筋的次品率?是否需要测量每根钢筋的强度呢?一般来说是不需要的.只要从这10000根钢筋中抽取一部分,比如100根,测量这100根钢筋的强度的,就可以推断出整批钢筋的次品率了,这就是抽样检验.事实上,全面检验是有困难的有些检验是有破坏性的,如使用寿命;产品数量大,或检验成本太高,人力、物力、时间不允许等例如:有一批棉花,需要检查纤维的长度,我们当然不可能去测量每一根棉花纤维的长度。数理统计提供了一整套方法,保证可以通抽样检验做出可靠的科学结论。直观地说,被观察对象的全体称作总体;总体的每一基本单元称作个体或样品;从总体中抽出的一部分个体组成一个样本,样本中所含个体的个数称作样本的容量或大小。如

4、前例所说,10000根钢筋的强度是总体,每一根钢筋的强度是一个个体,抽查的100根钢筋的强度是一个样本,它的容量是100。更确切的说,对这批钢筋,我们关心的是它的强度的分布,如强度低于52kg/mm^2的比例是多少.设X表示“任一根钢筋的强度”,X是一个随机变量.它的概率分布就反映了这批钢筋的强度的分布,即把总体看做一个随机变量。从总体中抽取一个个体就是做一次随机试验,而“任取n根钢筋,测其强度”就是做n次随机试验,得到容量为n的样本.因为抽取是随机的,故可以样本看做n个随机变量。当试验是重复独立试验时,与总体有相同的分布,这样的样本称作简单随机样本。定义设是一个随机变量,是一组相互独立与具

5、有相同分布的随机变量.称为总体,为来自总体的简单随机样本,简称样本.为样本容量.在一次试验中,样本的观察值称作样本值.由定义,若总体是离散型随机变量,其分布律为则样本的联合分布为若是连续型随机变量,其分布密度为则样本的联合分布密度是二、频率分布表与直方图一、频率分布表设总体是离散型随机变量,是一组样本值,取到的值为,并且取到的个数分别为,则样本容量,我们称为出现的频数,而出现的频率为显然,根据样本值把诸的频数和频率列成表格,称作频数分布表和频率分布表.例1对100块焊接完的电路板进行检查,每块板上焊点不光滑的个数的频数分布表和频率分布表如下图所示(不光滑点的个数)12345678910111

6、2合计(频数)4451091515149753100(=/100)1从上表可大体知道这批电路板的不光滑情况,可近似地作为“每块板上不光滑点个数”X的分布律.二、直方图当总体是连续型随机变量时,可采用直方图来处理数据(样本值).设为给定的一组样本值,处理步骤如下:1)简化数据,令由于数据总在某个某个数值上下波动,可以选取适当的常数,把样本值化为位数较少的整数,为方面起见,化简后的数值仍记为.2)求中的最大最小值.记3)分组.a)确定组数和组距.选定组数,取组距一般情况下,应取数据的最小单位的整数倍.b)确定各组的上下界.取第一组的下界应略小于,使得落入第一组内,即然后令为了使每个数据都落入组内

7、,应使分点比样本值多一位小数.计算频率,记为落入第个区间的频数,则频率为画直方图.以为底,为高画小长方形.显然,所有小长方形面积之和等于1:样本直方图与密度函数的关系?根据大数定律,近似等于随机变量落入区间内的概率,即设的密度函数为,则如果在区间内连续下面举例说明画直方图的全过程及注意事项例2某食品厂为加强质量管理,在某天生产的一大批罐头中抽查了100个,测得内装食品的净重数据如下(单位:g):3423413

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。