欢迎来到天天文库
浏览记录
ID:48813852
大小:2.13 MB
页数:35页
时间:2020-01-28
《大学数理统计 第一节 随机样本.ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、数理统计数学与计算机科学系段彦玲要求和学习方法:要求同学们按时来上课、听课,遵守课堂纪律,保持安静,不影响大家听讲;平时成绩占总成绩的30%.学习中遇到问题解决方法:发邮件、课前课后答疑、网上留言(357553155).2关于课程的学习一、主动学习,自学能力培养。二、要边学习、边研究,以学习的态度研究,以研究的态度学习。定义:数理统计学是数学的一个分支,它研究怎样用有效的方法去收集、整理、分析带随机影响的数据,并在此基础上对所讨论的问题给出统计性的估计和推断。4数理统计学的内容(A)概括为两大类用有效的方法去收集数据。抽样理论和试验设计有效地使用数据。中心内容—统计推断它包括参
2、数估计,假设检验,回归分析,方差分析,多元统计分析等等。5有效性的含义上述有效性有两个含义:可以建立一个在数学上便于处理的模型来描述所得的数据,数据中要包含尽可能多的与所研究的问题有关的信息。6关于统计推断由于统计推断中使用的仅仅是部分数据,且带有随机性,故所得结论只能做到尽可能而非绝对的精确可靠,而结论的正确性程度显然可以用概率来度量,因此概率论是数理统计的基础。统计方法的具体使用并不需要很高深的数学知识,但不具备较多较深的数学知识,这些方法的理论依据就说不清楚。7对一批即将出国留学的学生进行调查,确定学业完成后愿意回国者所占的比例。对于“完成学业后,你是否会回国“这一问题,
3、很多人不希望透露自己的真实想法。为了得到正确的结论,我们将问题稍加调整,将“完成学业后,你是否会回国“定位问题a,另设问题b:“你的年龄是奇数”。将a、b组成一组问题,让被调查者抛硬币决定回答问题a或b,并且在问卷上不标示被调查者回答的是问题a还是问题b。假定有300人接受调查,结果有130个“是”。因为被调查者回答问题a、b的概率各50%,所以将各有约150人回答a或b问题。又被调查者年龄是奇数的概率各是50%,所以150个回答b问题的人中,约有75个“是”。那么130个"是"的答案中,约有55个"是"是问题a的答案,于是我们就可以得到完成学业后愿意回国者的比例约55/150
4、即11/30。为了探讨吸烟与患慢性支气管炎是否有关联,调查了339人.情况如下表:问:从这批数据能否断定患慢性支气管炎与吸烟有关?人数患慢性支气管炎未患慢性支气管炎合计吸烟43162205不吸烟13121134合计56283339第六章数理统计的基本概念第一节随机样本将研究对象的某项数量指标值的全体称为总体,总体中的每个元素称为个体.例如,考察某大学一年级新生的体重情况,年级新生体重值的全体就构成一个总体.其中的每一个新生的体重为一个个体.总体中所包含的个数称为总体的容量,则该校一容量为有限的称为有限总体;容量为无限的称为无限总体.总体与个体的关系,即集合论中集合与元素的关系.
5、它是一个随机变量(或多维随机变量),记为X.国产轿车每公里的耗油量国产轿车每公里耗油量的全体就是总体又如:研究某批国产轿车每公里的耗油量时,总体X是这批轿车每公里的耗油量,而其中每辆轿车的耗油量就是个体。样本为对总体分布及其特性进行统计推断,需按一定的规则从总体中抽取若干个体进行观察,该抽取过程称为抽样,个体称为样本,样本中所含个体数目称为样本的容量为对总体进行合理的统计推断,所抽取的部分我们还需要在相同的条件下进行多次重复的、故样本是一个随机变量(或向量).容量为的样本可独立的抽样观察,视为维随机向量样本定义6.1设总体X是具有分布函数F的随机变量,若一旦具体取定一组样本,便
6、得到样本的一次具体的观察值称其为样本值。简单随机样本满足下面两个条件:1.代表性:与所考察的总体具有相同的分布;是与X具有同一分布且相互独立的随机变量,则称为从总体X得到容量为n的简单随机样本,简称为样本。样本1.代表性:与所考察的总体具有相同的分布;2.独立性:是相互独立的随机变量.注:简单随机样本是一种非常理想化的样本.际应用中,对有限总体,若采用有放回抽样就能得到简单随机样本,但有放回抽样使用起来不方便,故实故实际操作中通常采用不着是无放回抽样,当所样本故实际操作中通常采用不着是无放回抽样,当所考察的总体很大时,可近似把无放回抽样所得到的样本看成是一个简单随机样本.对无限
7、总体,因抽取一个个体不影响它的分布,故采用无放回抽样即可得到的一个简单随机样本.样本分布设总体的分布函数为由样本的独立性,简单随机样本的联合分布函数为并称其为样本分布.(1)其概率分布为则样本的概率分布为则为离散型随机变量,若总体称其为离散样本密度.(2)其概率密度为为连续型随机变量,若总体样本分布(1)其概率分布为则样本的概率分布为为离散型随机变量,若总体称其为离散样本密度.(2)其概率密度为为连续型随机变量,若总体则样本的概率密度为称其为连续样本密度.统计是从手中已有的资料—样本值,去推
此文档下载收益归作者所有