欢迎来到天天文库
浏览记录
ID:46237496
大小:334.00 KB
页数:31页
时间:2019-11-22
《数理统计的基本概念1》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、§6.1数理统计的基本概念一.总体与样本二.样本数据的整理三.样本数据的图形显示四.常用统计量研究对象的全体称为总体构成总体的每个成员称为个体总体中所包含的个体的个数称为总体的容量.容量为有限的称为有限总体,容量为无限的称为无限总体。若抛开实际背景,总体就是一堆数,因此用一个概率分布去描述和归纳总体是恰当的,从这个意义看,总体就是一个分布,而其数量指标X就是服从这个分布的随机变量。例如我们称总体服从参数为λ的泊松分布,意指总体中的观测值X是服从参数为λ的泊松分布的随机变量。“从总体中抽样”与“从某分布中抽
2、样”是同一个意思一、总体与样本例1考察某厂的产品质量,将其产品只分为合格品与不合格品,并以0记合格品,以1记不合格品,则总体={该厂生产的全部合格品与不合格品}={由0或1组成的一堆数}若以p表示这堆数中1的比例(不合格品率),则该总体可由一个二点分布表示:01P1-pp不同的p反映了总体间的差异。如,两个生产同类产品的工厂的产品总体分布为:01P0.9150.08501P0.9830.017第一个工厂的产品质量优于第二个工厂从总体X中抽取有限个个体对其进行观察的取值过程称为抽样。从总体X中抽取一个个体,
3、就是对总体X进行一次观察并记录其结果。取样是随机的,且观察前无法预知起结果,故每个观察结果都是随机变量,且与总体同分布。定义1在相同的条件下,对总体X进行n次重复的、独立的观察,得到n个结果,称随机变量为来自总体X的容量n的简单随机样本,简称样本。其观测值称为样本值,又称为X的n个独立的观测值。注:总体X的简单随机样本具有两条性质:样本具有随机性,即要求总体中每一个个体都有同等机会被选入样本。样本容量很大,足以忽略取样方式是否重复,将非重复取样近似看作重复取样。样本具有独立性,即要求样本中每一个个体的取值
4、不影响其它个体的取值。对无限总体,随机性与独立性容易实现,困难在于排除有意或无意的人为干扰。对有限总体,只要总体所含个体数很大,特别是与样本量相比很大,则独立性也可基本得到满足。设总体X的分布函数为F(x),若为F的一个样本,则相互独立,且它们的分布函数都是F(x),所以()的分布函数为定义2若总体X的密度函数为f(x),则()的密度函数为例2啤酒厂生产的瓶装啤酒规定净含量为640克,由于随机性,事实上不可能使得所有的啤酒净含量均为640克。现从某厂生产的啤酒中随机抽取10瓶测定其净含量,得到如下结果:6
5、41635640637642638645643639640这是一个容量为10的样本的观测值,对应的总体为该厂生产的瓶装啤酒的净含量。例3(分组样本)我们考察某厂生产的某种电子元件的寿命,我们选了100只进行寿命试验,由于一些原因,我们不可能每时每刻对试验进行观测,而只能定期(比如每隔24小时)进行观测,于是,对每个元件,我们只能观测到其寿命落在某个范围内,得到下表所示的一组样本:寿命范围元件数fi寿命范围元件数fi寿命范围元件数fi(024]4(192216]6(384408]4(2448]8(21624
6、0]3(408432]4(4872]6(240264]3(432456]1(7296]5(264288]5(456480]2(96120]3(288312]5(480504]2(120144]4(312336]3(504528]3(144168]5(316360]5(528552]1(168192]4(360384]1>55213表中的样本观测值没有具体的数值,只有一个范围,这样的样本称为分组样本。相应的,例2中的10个啤酒净含量称为完全样本。分组样本与完全样本相比在信息上总有损失,这是分组样本的缺点。但
7、在实际中,在样本量特别大时(如n>100时),又常用分组样本来代替完全样本,它能简明扼要地表示样本,使人们能更好地认识总体,这是分组样本的优点。这时需要对样本进行分组整理。寿命范围元件数fi寿命范围元件数fi寿命范围元件数fi(024]4(192216]6(384408]4(2448]8(216240]3(408432]4(4872]6(240264]3(432456]1(7296]5(264288]5(456480]2(96120]3(288312]5(480504]2(120144]4(312336]
8、3(504528]3(144168]5(316360]5(528552]1(168192]4(360384]1>55213定义3则经验分布函数的观测值为设为(一).经验分布函数二.样本数据的整理例4某食品厂生产听装饮料,现从生产线上随机抽取5听饮料,称得其净重为(单位:克)351347355344351这是一个容量为5的样本,经排序可得有序样本:其经验分布函数为例5下表是经过整理后得到的分组样本组序12345分组区间(38,4
此文档下载收益归作者所有