资源描述:
《一,对总体分布函数F(x)的假设检验》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、一、对总体分布函数F(x)的假设检验二、对随机变量的独立性、相关性的假设检验例如,1.考察某一产品的质量指标打算用正态分布模型2.考察一种元件的寿命打算用指数分布模型3.一个骰子是否是均匀的?假设H0:X~N(,2)假设H0:X服从参数为的指数分布假设H0:这个骰子是均匀的这里主要介绍拟合优度检验(卡方检验法)。H0:F(x)=F0(x),H1:F(x)≠F0(x)§8.3非参数假设检验卡方检验(K.Pearson,拟合优度检验)设X为未知总体,(x1,x2,…,xn)为大样本(n≥50),欲检验H0:F(x)=F0(x),H
2、1:F(x)≠F0(x)把实数轴(-∞,+∞)分成k个互不相交的区间:(-∞,a1],(a1,a2],…,(ak-2,ak-1],(ak-1,+)记a0=-∞,ak=+,Ii=(ak-2,ak-1](i=1,2,…,k-1),Ik=(ak-1,+),ni为样本观测值(X的取值)落在第i个小区间Ii的个数,pi为X取值落入第i个小区间Ii的概率,03、sher联合证明了:定理不论F0(x)是何分布函数,只要n充分大(n≥50),当假设H0成立时,上述2统计量都近似地服从自由度为k-r-1的2分布。其中r是F0(x)中未知参数的个数。称ni为实测频数,vi=npi为理论频数。称这类检验为拟合优度检验。对于给定的,查2分布表得临界值2(k-r-1),使由样本值计算出2统计量的值,当2﹥2(k-r-1)时拒绝H02≤2(k-r-1)时接受H0可见,皮尔逊定理(准则)适用于实测频数与理论频数相比较的问题。几点注释①若分布函数F0(x)的类型未知,可由实际问题分析
4、或由样本观察数据的直方图来推测。②若已知F0(x)分布类型,还有r个参数未知时,须先用极大似然估计法求出未知参数的估计值,然后再作假设。③此检验要求一定是大样本,一般n≥50。至于k的大小,对于正态总体,样本容量n与区间个数k要满足渐近最优关系k=1.87(n-1)0.4④若理论频数vi=npi<5时,则将相临的小区间合并,直至全部npi≥5(合并区间的同时,也将实测频数合并),合并后的小区间数设为k*,则此时2统计量的由度变为df=k*-r-1⑤手工计算时常采用公式N501002005001000200010000k912162
5、2305674=(-1.22)-(-1.68)=0.0647.类似地算得:p3=0.1124,p4=0.1547,p5=0.1813,p6=0.1695,p7=0.1286,p8=0.0793,p9=0.0630.例1设从总体X中抽取120个样本观察值,经计算整理得下表,试检验X服从正态分布。(=0.05)组号小区间ni1(-∞,198]62(198,201]73(201,204]144(204,207]205(207,210]236(210,213]227(213,216]148(216,219]89(219,+∞)6∑12
6、0解这里只给出了分布类型,有两个待估参数与2。用极大似然法对与2作出估计,得到故提出假设H0:X~N(209,42.77)H1:X不服从N(209,42.77)由n=120,算得统计量的值由于所以接受H0,认为X~N(209,42.77).=0.05,k=9,r=2.查表得临界值解首先,用样本观察值对未知参数作极大似然估计。以xi表示区间(ti-1,ti)的中点(也称为组中值),则故提出假设H0:X服从=0.2的指数分布.当H0为真时,有例2对200个电池做寿命试验,(ti-1,ti)表示以小时计的时间区间(i=1,2
7、,…,6),在=0.05下,试检验电池寿命X服从指数分布。组序(ti-1,ti)ni1(0,5)1332(5,10)453(10,15)154(15,20)45(20,25)26(25,30)1∑200由=0.05得类似地算出:p3=0.0855,p4=0.03147,p5=0.0016,p6=0.0043.各vi=npi分别为:126.42,46.52,17.10,6.30,2.32,0.84.由于v5和v6都小于5,且合并后仍小于5,故与v4合并.组序nivi=npini-npi(ni-npi)2/npi1133126.42
8、6.580.342524546.52-1.520.049731517.10-2.100.2579479.46-2.460.63972002001.29由于2﹤2(k-r-1),故接受H0,即认为X服从参数=0.2的指数分布。