资源描述:
《概率与数理统计课件第6章数理统计》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第六章数理统计第一节引言本章转入课程的第二部分数理统计数理统计的特点是应用面广,分支较多.社会的发展不断向统计提出新的问题.计算机的诞生与发展,为数据处理提供了强有力的技术支持,数理统计与计算机的结合是必然的发展趋势.学习统计无须把过多时间化在计算上,可以更有效地把时间用在基本概念、方法原理的正确理解上.国内外著名的统计软件包:SAS,SPSS,MATLAB,STAT等,都可以让你快速、简便地进行数据处理和分析.从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作.但
2、是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断.到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科.数理统计学数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析.由于大量随机现象必然呈现出它的规律性,因而从理论上讲,只要对
3、随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来.只允许我们对随机现象进行次数不多的观察试验,也就是说,我们获得的只是局部观察资料.但客观上数理统计的任务就是研究怎样有效地收集、整理、分析所获得的有限的资料,对所研究的问题,尽可能地作出精确而可靠的结论.现实世界中存在着形形色色的数据,分析这些数据需要多种多样的方法.因此,数理统计中的方法和支持这些方法的相应理论是相当丰富的.概括起来可以归纳成两大类:参数估计──根据数据,用一些方法对分布的未知参数进行估计.假设检验──根据数据,用一些方法对分
4、布的未知参数进行检验.它们构成了统计推断的两种基本形式.这两种推断渗透到了数理统计的每个分支.第六章第二节总体与样本在统计学中,将我们研究的问题所涉及的对象的全体称为总体,而把总体中的每个成员称为个体.例如:我们想要研究一家工厂的某种产品的废品率.这种产品的全体就是我们的总体,而每件产品则是个体.一、总体实际上,我们真正关心的并不是总体或个体的本身,而是其某项数量指标.比如某家工厂的一种产品的使用寿命这样一项数量指标.因此,我们应该把总体理解为那些研究对象上的某项数量指标的全体.为了评价一家工厂的某种产品的质量的好
5、坏,通常的做法是从它的全部产品中随机地抽取一些样品,在统计学上称为样本.同上道理,我们实际是把样本理解为样品上的数量指标.因此,今后当我们说到总体和样本时,既指研究对象又指它们的某项数量指标.说明研究某地区N个农户的年收人.在这里,总体既指这N个农户,又指我们关心的数量指标──他们的年收入的N个数字.如果我们从这N个农户中随机地抽出n个农户作为调查对象,那么,这n个农户以及我们关心的数量指标──他们的年收入这n个数字就是样本.在上面的例子中,总体是很直观的,是看得见摸得着的.但是客观情况并不总是这样.例1注意用一把
6、尺子去量一个物体的长度.假定n次测量值为X1,X2,,Xn显然,在这个问题中,我们把测量值X1,X2,,Xn看成了样本,但是,总体是什么呢?例2事实上,这里没有一个现实存在的个体的集合可以作为我们的总体.可是,我们可以这样考虑,既然n个测量值X1,X2,,Xn是样本,那么总体就应该理解为一切所有可能的测量值的全体.分析:这种类型的总体的例子不胜枚举.例如:为研究某种安眠药的药效,让n个病人同时服用此药,记录下他们各自服药后的睡眠时间比未服药时延长的小时数.X1,X2,,Xn这些数字就是样本.什么是总体呢?设
7、想让某个地区或某个国家,甚至全世界所有患失眠症的病人都服用此药,他们所增加的睡眠时间的小时数的全体,就是该问题中的总体.对一个总体,如果我们用X表示它的数量指标,那么X的值对不同的个体取不同的值.因此,如果我们随机地抽取个体,则X的值也就随着抽取的个体的不同而不同.所以X是一个随机变量!既然总体是随机变量X,自然就有其概率分布.我们把X的分布称为总体的分布.总体的特性是由总体分布来刻画的.因此,我们常把总体和总体分布视为同义语.二、总体的分布例l中,若农户年收入以万元计,假定N户中收入X为以下几种取值:0.5,0.
8、8,l,1.2和1.5.取这些值的农户个数分别为:n1,n2,n3,n4,n5,(这里n1+n2+n3+n4+n5=N).则总体X的分布为离散型分布,其分布律为:例3(例l续)例2中,假定物体的真正长度为(未知).一般说来测量值X,也就是我们的总体,取附近值的概率要大一些,而离愈远的值被取到的概率就小一些.如果测量过程没有系统性误差,那么X取大于和小