欢迎来到天天文库
浏览记录
ID:27292500
大小:484.50 KB
页数:27页
时间:2018-12-01
《《非参数统计》ppt课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第七章非参数统计非参数统计(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。主要特点不要求总体分布已知或对总体分布作任何限制性假定;不以估计总体参数为目的;能适用于定性变量中的定类数据或定序数据,也能适用于定距数据和定比数据这种定量变量方法直观,易于理解,运算比较简单。缺点是检验的功效不如参数检验方法。主要内容χ2检验成对比较检验曼—惠特尼U检验游程检验等级相关检验χ2检验一、什么是χ2检验χ2检验是利用随机样本对总体分布与某种特定分布拟合程度的检验,也就是检验观察值与理论值之间的
2、紧密程度。设有k(K>2)个观察值,f0为它们的实际频数,fe为理论频数。构造一个统计量其中,k-1为自由度。皮尔生定理表明,当样本容量充分大时,样本分成K类,则χ2统计量服从χ2分布。自由度为k-11、拟合优度检验二、应用利用样本信息对总体分布作出推断,检验总体是否服从某种理论分布(如二项分布、均匀分布或正态分布等)。检验步骤抽样并对样本资料编成频数分布,形成k个互斥的类型组。(f0)对总体分布建立假设H0:总体服从某种理论分布H1:总体不服从该理论分布以“原假设H0为真”导出一组期望频数(fe)计算检验统计量比
3、较χ2值与临界值作出检验判断自由度(df)=k-1-m。其中k为组数。(各组理论频数不得小于5,如不足5,可合并相邻的组,如需合并,则k为合并后的组数)m为计算理论频数时所估计参数的个数。(未指定总体的参数,需要观察值计算相应的统计量,作为未参数的估计值)。2、独立性检验二、应用用于判断两个变量是否存在交互影响。如果两个变量不存在交互影响,就称为独立,所以这类检验也称为独立性检验。检验步骤对总体的两个变量建立假设H0:两变量独立H1:两变量关联将样本资料编成r×c列联表,并列出实际频数Oij计算理论频数计算检验统计
4、量比较χ2值与临界值作出检验判断要点说明列联表形式(r×c)O11O21O31...Or1O12O22O32...Or2O13O23O33...Or3………...…O1cO2cO3c...OrcO1O2O3...Or123...r行(r)列(c)123…cxy合计n.1n.2n.3…n.cn合计X的边缘频数y的边缘频数理论频数Eij的计算先求理论频率(作为概率的近似)。概率论中关于概率独立的基本规则:如果两事件独立,则它们的联合概率等于它们各自概率的乘积,P(A·B)=P(A)·P(B)。因此,某一行某一列的联合概
5、率:自由度(df)的确定df=(r-1)(c-1)r·c=2×2的列联表资料,χ2值简算公式xy1212abcda+cb+da+bc+d合计合计n成对比较检验是对两个相关样本的比较分析。有符号检验和威尔科克森带符号的等级检验两种方法。符号检验也称正负号检验,其基本思想是分析正负号出现的频率而忽略具体量的差异,以确定他们是否有显著差异的一种检验方法。检验步骤1.确定配对样本,分别计算差异正与负的数目,无差异则记为0,将它从样本中剔除,并相应地减少样本容量n,把正负号数目之和视为样本总个数(n)。2.建立假设:H0:
6、p=0.5;H1:p≠0.53.观察样本容量,如果n≤25,则作为二项分布处理如果n>25,则作为正态近似处理。4.设定显著性水平α,并查表确定临界值,进行比较和作出判断。例1:随机抽取12个单位,放映一部描述吸烟有害健康的影片,并调查得到观看电影前后各单位职工认为吸烟有害的人数的百分比。检验该电影宣传是否有效果(α=0.05)。解:H0:P=0.5H1:P>0.5P(0)=0.0002,P(1)=0.0030,P(2)=0.0161,P(3)=0.0537P(0)+P(1)+P(2)=0.0193<0.05P
7、(3)+0.0193=0.0537+0.0193=0.073>0.050123456可见,拒绝域应为0,1,2。789101112拒绝域现检验统计量(-)=3(即3个负号),0.073>0.05所以,原假设H0:P=0.5在5%显著性水平上不能被拒绝。也即不能认为职工在观看影片前后的认识有显著提高。例2:随机抽取60名消费者对甲、乙两种品牌的饮料评分,甲、乙得分之差为“+”号者35个,“-”号15个,“0”号10个。以显著性水平α=0.05检验两种饮料是否同等受欢迎。解:H0:P=0.5,H1:P≠0.5∵n>25
8、,∴按正态分布近似处理该成数抽样分布的均值和标准差分别为2.82>1.96,所以,拒绝原假设。认为两种饮料并不受到同等欢迎。且乙种优于甲种。威尔科克森带符号的等级检验这种检验方法不仅考虑了两组数据差异的正、负号,而且还利用了其差异大小的信息。因此,是一种更为有效的检验方法。1、应用条件和检验内容与符号检验相同。2、方法思想:若关联样本的两组数据没有显著差异,
此文档下载收益归作者所有