非参数假设检验.ppt

非参数假设检验.ppt

ID:61530303

大小:889.44 KB

页数:43页

时间:2021-02-25

非参数假设检验.ppt_第1页
非参数假设检验.ppt_第2页
非参数假设检验.ppt_第3页
非参数假设检验.ppt_第4页
非参数假设检验.ppt_第5页
资源描述:

《非参数假设检验.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三节非参数假设检验我们已讨论的假设检验是建立在假定样本来自的总体是正态分布的。当没有这个假定或不成立时,这些检验的结论就可能被质疑。为了解决该问题,统计学家发展了无需上述假定的非参数检验。一、非参数假设检验1.定义:它泛指参数假设检验以外的各种检验。2.特点:(1)非参数检验不依赖于总体分布。(2)非参数假设检验适用于较低的计量水平,如等级、顺序的计量等。(3)常常用于参数以外的检验,如随机变量是否服从某种规律、某种分布的拟合优度检验,数据是否随机的游程检验等。1.如何探讨数据规律(一)分类数据的拟合优度检验显示数据规律性的方法:频数分布表,能否了解数据来自某一分布或与某一理论分布

2、相一致的程度如何?直方图和统计量的检测可能给出了一些探索性的假设。然而,这些应该用一些较为正规的方式来加以论证。拟合优度检验给出了统计意义上的证据来检验有关分布的假设。最为通用的拟合优度检验是卡方检验。拟合优度的卡方检验的假设为::抽样数据来自于一个特殊的分布(如正态分布):抽样数据不是来自于这个特殊的分布2.利用进行拟合优度检验的步骤:第一步:先将观测到的数据分类,假设分成m类,每类中的频数为第二步:根据观测结果似乎服从某一理论分布的规律,需要进一步检验。按照理论分布,各类的频数应为:根据理论分布,观测发生在第i类的概率。第三步:计算统计量如果理论分布的参数是预先给定的(已知的),

3、则统计量服从自由度为m-1的分布。若理论分布的参数是未知的,需要用样本观测值来估计时,统计量服从自由度为m-r-1的分布,其中r为需要估计的参数的个数。第四步:根据显著性水平a查分布表求相应的临界值——时,拒绝原假设,说明样本观测并非来自该理论分布。【例6.10】某百货公司的电器部下半年各月洗衣机的销售数量如下:该电器部经理想了解洗衣机的销售数量是否在各月是均匀分布的,也就是说各月中销售数量的差别可以归结为随机原因,这样可以为以后的进货提供依据。要求以a=0.05的显著性水平进行检验。解:本例中的观测值以月为组,共分为m=6组,每月的销售台数即为观测的频数,观测的总次数为n=150。

4、现欲检验是否服从(离散的)均匀分布,即每月的销售量是否为为此,设:洗衣机销售量服从均匀分布;:并不服从均匀分布;计算统计量的值:,说明下半年各月销售量与均匀分布有差别,这些差别尚不能完全归结为随机原因。在本例的情况下,统计量的自由度为m-1=6-1=5。查表得知,【例6.11】在高速公路收费站100分钟内观测到通过收费站的汽车共190辆,每分钟通过的汽车辆数分布如下表:用显著性水平a=0.05检验这些数据是否来自泊松分布。解:设:汽车通过收费站的辆数服从泊松分布;:不服从泊松分布。观测值分为5组,且有回忆泊松分布其中为泊松分布的期望值,是未知的,需要用样本观测值来估计。由于100分钟

5、内观测到190辆汽车,所以平均每分钟观测到190/100=1.9辆汽车,故取。据此,我们可以用参数的泊松分布来计算每分钟内通过收费站的汽车为0辆、1辆、2辆、3辆、4辆或更多的概率。计算统计量的值:自由度为m-1-1=5-1-1=3,临界值,说明每分钟通过收费站的汽车辆数不服从泊松分布。各概率乘以观测总数n=100,便得到理论频数,具体结果见下表:在应用分布拟合优度检验时,应注意每一类中理论频数不宜过小,通常应不小于5。如果出现理论频数太低,就应当与邻近的类进行合并。(二)分布的独立性检验拟合优度检验是根据样本观测值与一个理论值进行比较来检验的,但是有些数值并不知道服从何种理论分布。

6、因此在双边量的分布中,有时想了解两个变量是相依的还是独立的。卡方检验可用于这样的检验,称作卡方的独立性检验。这种情况下可以使用列连表进行分析,并用卡方进行独立性检验。列连表是一个表示两个分类变量的r行c列的矩阵。1.如何探讨两个变量是相依的还是独立的——的独立性检验2.检验的基础——列联表·列联表的构成·理论频数的计算·独立性检验的统计量P187表6.2表6.2是最简单的2行2列的列联表,它可以扩展到r×c列联表。代表行的第1类和列的第1类所出现的实际频数,依次类推。那么相应于理论值如何计算呢?因为位于第1行,整个样本量为n,落入第1行的概率根据样本估计应该是,又同时位于第1列,落入

7、第1列的概率根据样本计算应该是根据概率论的原理,如果行和列的变量是独立的,那么落入第1行和第1列的概率应该是,由于样本量为n,则落入第1行第1列的理论频数应该是由此可以推广到在独立性检验中的统计量为【例6.12】某副食品商店欲研究顾客的性别与购物金额大小之间是有关系,还是没有关系(意味着相互独立)。在该商店内随机调查了548位顾客,按金额大小和性别进行分类,取得如下数据(见表6.3):表6.3顾客的性别与购买金额列联表(括号内是理论频数)要求用a=0.05

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。