欢迎来到天天文库
浏览记录
ID:13894491
大小:1.40 MB
页数:79页
时间:2018-07-24
《实验七 描述性统计分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第四章非参数统计实验参数统计学中的许多统计分析方法的应用对总体都有严格的假定,例如,t检验要求总体服从正态分布,F检验要求误差呈正态分布且各组方差为齐性的等等,然而在现实生活中,有许多总体的分布我们却是一无所知或知之甚少,所以在参数模型中所建立的统计推断就会失效,于是,人们希望在不假定总体分布的情况下,尽量从数据本身来获得所需要的信息。这就是非参数统计的宗旨。非参数统计方法简便,适用性强,但检验效率较低,应用时应加以考虑。实验一卡方检验(Chi-squaretest)实验目的:掌握卡方检验方法。实验内容:一、拟合优度检验二、独立性检验三、齐性检验实验工具
2、:SPSS非参数统计分析菜单项和Crosstabs菜单项。知识准备:一、卡方拟合优度检验检验(Chi—SquareTest)适用于拟合优度检验,适用于定类变量的检验问题,用来检验实际观察数目与理论期望数目是否有显著差异。当检验问题是实际分布是否与理论分布相符合时,在大样本时也可以用分类数据的卡方检验来解决,这时的卡方检验也称为分布拟合的卡方检验。若样本分为k类,每类实际观察频数为,与其相对应的期望频数为,则检验统计量可以测度观察频数与期望频数之间的差异。其计算公式为:很显然,实际频数与望频数越接近,值就越小,若=0,则上式中分子的每—项都必须是0,这意味
3、着k类中每一类观察频数与期望频数完全一样,即完全拟合。统计量可以用来测度实际观察频数与期望频数之间的拟合程度。在H0成立的条件下,样本容量n充分大时,统计量近似地服从自由度df=k-1的分布,因而,可以根据给定的显著性水平,在临界值表中查到相应的临界值。若,则拒绝H0,否则不能拒绝H0。所有的统计软件都可以输出检验统计量的显著性值,也可以根据显著性值和显著性水平作比较,若,则拒绝H0,否则不能拒绝H0。另外卡方拟合优度检验也可以用来检验某总体是否服从某一特定分布的假设。拟合优度检验中几种常用分布的参数如表4-1:表4-1拟合优度检验中几种分布的参数分布参
4、数估计值参数个数df二项分布1k-2泊松分布1k-2正态分布2k-3指数分布1k-2二、独立性检验假设有个随机试验的结果按照两个变量A和B分类,A取值为A1,A2,…,Ar,B取值为B1,B2,…,Bs,则形成了一张的列联表,称为二维列联表。其中表示A取Ai及B取Bj的频数,,其中:表示各行的频数之和表示各列的频数之和令(),和分别表示各行和各列的边缘概率,对于二维列联表,如果变量A和变量B是独立的,则A和B的联合概率应该等于A和B边缘概率的乘积。因而有如下检验:在H0成立的条件下,二维列联表中的期望频数为:则如果期望频数,则统计量近似服从自由度为的卡方
5、分布。如果Pearson值过大,或p值过小,则拒绝H0,认为变量A和变量B存在某种关联,即不是独立的;否则不能拒绝H0,认为是独立的。如果期望,则需要将其合并使得期望频数,否则容易夸大卡方统计量值,导致拒绝原假设的结论。三、齐性检验与独立性检验类似的是齐性检验。实际问题中,假设有n组从不同来源得到的数据,要判定这些数据的来源是否相同(相同的分布),统计上我们可以将这些问题表述为:假定有k组样本,分别取自k个总体,要检验这k个总体的分布是否相同。这样的假设检验问题称为“齐次性检验”。对一般的二维列联表,可以提出假设:()在H0成立的条件下,这些概率与j无关
6、,因此的期望值(理论频数)为,,因此期望值,则检验统计量为:与独立性检验一样,如果,则统计量近似服从自由度为的卡方分布。如果Pearson值过大,或p值过小,则拒绝H0,;否则不能拒绝H0。实验背景:一、据以往经验,机床发生故障的频数服从均匀分布,某车间在一周内统计所有机床发生故障频数的资料如下:表4-2故障频数星期一二三四五六故障次数78391617检验故障频数是否服从均匀分布()?二、在丧偶问题上的性别因素和地区因素是否独立按照1996年一个抽样,我国华北五省市区的丧偶人数按性别分为:表4-31996年华北地区丧偶情况统计男女合计北京11235647
7、8天津130305435河北84617872633山西3597821141内蒙古291558849合计174837885536检验在丧偶数量上性别因素和地区因素是否独立。三、在一个有三个主要百货商场的商贸中心,调查者问479个不同年龄段的人首先去三个商场中的哪个,结果如下表:表4-4调查结果年龄段商场1商场2商场3总和≤3083704519831—50918615192>5041381089总和21519470479检验人们去这三个商场的概率是否一样。(数据来源:《非参数统计》,王星,中国人民大学出版社,P161)实验过程:一、用Chi-Square过程
8、进行拟合优度检验激活数据管理窗口,定义变量名:每天为day,故障次数为count
此文档下载收益归作者所有