卡方拟合优度检验

卡方拟合优度检验

ID:40133735

大小:813.81 KB

页数:26页

时间:2019-07-22

卡方拟合优度检验_第1页
卡方拟合优度检验_第2页
卡方拟合优度检验_第3页
卡方拟合优度检验_第4页
卡方拟合优度检验_第5页
资源描述:

《卡方拟合优度检验》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第五章c2拟合优度检验及其应用第一节c2拟合优度检验二项分布(0-1数据)考虑比例问题:P(X=1)=p,P(X=0)=1–p假设检验:H0:p=p0;H1:pp0。样本统计:1的频数为k,0的频数为n–k。检验统计量及其分布:等价的检验统计量及其分布也可以写成:总体分类A1(X=1)A2(X=0)合计理论频数E1=np0E2=n(1–p0)n观测频数O1=kO2=n–kn理论H0的检验统计量及其分布:例1:某机构认为公众对某项事业的看法无所谓,并通过调查来进行实证,却得到相反的证据,数据如下:总体分类赞成反对合计理论频数5050100观测频数4060100多项分布(属性数据)

2、考虑多项分布问题:假设检验:数据结构:总体分类A1(X=1)……As(X=s)合计理论频数E1=np10……Es=nps0n观测频数O1……Osn理论H0的检验统计量及其分布:在近似计算方面,尽可能要求所有观测频数Oi≥5,容许个别为3或4;否则,对某些类进行合并。例2:骰子的检验某人在赌场对掷骰子观测了120次,获得数据:朝上的面i123456合计理论值Ei202020202020120观测值Oi132816103221120Ei–Oi7–8410–12–10(Ei–Oi)24964161001441(Ei–Oi)2/Ei2.453.200.805.007.200.0518.7

3、0P值=0.003因此,可以认为骰子不均匀或赌场有作弊行为。例3:判定样本的不随机性有一项调查据称是在某地区随机进行的。该地区各年龄段(或其它分组方式)的人口比例是已知的。样本量为1000,具体数据如下:数据分组1234567合计各组比例0.150.20.20.150.150.10.051理论值Ei150200200150150100501000观测值Oi13024017013018090601000Ei–Oi20–403020–3010–100(Ei–Oi)24001600900400900100100(Ei–Oi)2/Ei2.6784.52.6761226.83P值=0.00

4、02因此,可以认为该调查的随机性是有问题的。一般分布的检验(属性数据或连续数据)检验方法:对总体进行随机抽样,得样本X1,…,Xn;按某种方式所得到的总体分类A1,…,As对样本进行频数统计,得观测频数O1,…,Os;用极大似然法估计参数q1,…,qr;得估计值计算观测频数O1,…,Os的理论值E1,…,Es,即在H0下等于:理论H0的检验统计量及其分布:例4:120名成年男子红细胞数的正态性检验组段理论频数E观察频数OE-O(E-O)2(E-O)2/E3.20~1.872-0.130.0170.0093.50~4.495-0.510.260.0563.80~10.5100.50

5、.250.0244.10~18.519-0.50.250.0144.40~24.6231.62.560.1044.70~24.6240.60.360.0155.00~18.521-2.56.250.3385.30~10.511-0.50.250.0245.60~4.4940.490.240.0535.90~6.201.8710.870.760.405合计1201200.01.042P值为0.99,故不拒绝正态性假设。120名成年男子红细胞数的直方图例5:30年代卢瑟福观测了在7.5秒时间内X射线到达指定区域的质点数,共观测2608次,获得统计数据:出现点数i0123456789≥

6、10合计理论值Ei572033835255324082731394527162608观测值Oi542114075265083932541406829172608Ei–Oi3–8–24–1241519–1–23–3–10(Ei–Oi)2/Ei0.1240.2671.460.001.100.5341.450.0127.720.1660.0712.91这里,普阿松分布:l的估计值:理论值Ei:,P值为0.1667。第二节齐一性检验两个总体分布的齐一性检验比较两个总体的分布函数F1(X)和F2(X)是否一致?假设检验:H0:F1(X)=F2(X);H1:F1(X)≠F2(X)。对这两个总

7、体进行独立抽样,分别获得F1(X)和F2(X)的独立样本这两个总体变量的值域应该一致。我们把该值域分成s段A1,…,As(分类方法要求与样本独立),比较F1(X)和F2(X)在A1,…,As上的分布或比例是否一致。对这两个独立样本出现的频数分别进行统计,记作数据结构:总体分类A1……As合计X频数n11……n1sn1Y频数n21……n2sn2合计n*1……n*sn这里当s=2时,上面的数据结构就是四格表。故且H0:F1(X)=F2(X)成立时,意味着是来自同一个总体,且所以N1j

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。