资源描述:
《非参数统计基本概念》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、§非参数统计基本概念知识回顾势函数(检验的势)无偏检验经验分布检验的相对效率§非参数统计知识回顾势函数(检验的势)无偏检验经验分布检验的相对效率点估计:方法及原理置信区间:正态分布假设检验:原理,步骤,二类错误,检验的两种方法P值•零假设下,P(T>t)的值称为p值。•若p值很小,说明观测值的实现在零假设下为小概率事件,故拒绝零假设。犯第一类错误的概率为p。•若p值很大,则不能拒绝零假设,而此时可能犯第二类错误。H1正确时,拒绝H0的概率称为检验的势。•强势的检验比弱势的检验更容易拒绝零假设。•势依赖很多原因:显著性水平,参数的真值,样本大小,检验
2、统计量的选择。•利用信息越多的检验统计量势越大;其他条件一样时,势越大,检验越有效。•统计软件一般不给出,仅给出p值。显著性水平由用户自己决定。•注意:显著性检验的主要目的拒绝零假设。置信区间:•包含参数的区间Pˆ0C1,的1置信区间为ˆC,ˆC单边检验和双边检验的p值??连续性修正•当用连续性分布去近似离散分布时,常常用连续性修正。•对一个离散分布的点的概率P(X=x),用连续分布相应的区间概率来近似。相应离散点的概率就变换成连续分布密度函数曲线下单位区间的面积。•对二项分布,超几何分布,Pisson分布做正态近似时,常
3、用连续性修正。•二项分布Bin(n,p):=•超几何分布:•=,这里p=S/N数据处理•拿到数据时,首先要有一个直观概念。•若数据来自一个总体,先通过绘图(直方图、箱线图、茎叶图、Q-Q图、P-P图等)了解它的大致分布情况,如是否对称,是否有很长的尾部,是否有远离数据主体的点等。•若数据来自不同总体,除了上述了解,还需要看各样本的形状是否类似,通过二维或三维图观察样本间的联系或相关性。•P12的图1.1给出了x和y样本的直方图、盒形图及相对于正态分布的QQ图.•数据常常需要处理以符合非参数统计推断方法的某些条件,最常用的是指数变换。OC函数的定义和含义若C是参数的某
4、检验问题的一个检验法,()P(接受H)00称为检验法C的施行特征函数或OC函数,其图形称为OC曲线.理解:当H,则0()=接P(受H)PH(为真时接受H)H0000而PH(为真时拒绝H)00所以()1当H,则犯第II类错误的概率就是1()=接P(受H)PH(为不真时接受H)H0001所以1()就表示H0为不真时拒绝H0的概率称函数1()是检验法C的功效函数。§非参数统计知识回顾势函数(检验的势)无偏检验经验分布检验的相对效率2.2势函数即不犯第II类错误的概率,此时为检验犯第II类错误的概率Rema
5、rk:势越大越好(如此才是有意义的检验)低势的检验说明检验在区分零假设和备择假设方法的价值不大例2.1:电话交换台单位时间内接到的呼唤次数服从Poisson分布P(),为单位时间内接到的平均呼唤次数。考察该交换台在单位时间内的平均呼唤次数是否超过1。•Poisson分布H:>1H:01•按照假设检验的步骤,可以选取统计量为检验统计量,检验的目的是使得()P(XiC)足够小()和()随的变化()和()随的变化1.00.8C=5C=70.6pp0.4()()0.2()0.00.00.51.01.52.0lamda同样显著性
6、水平之下的检验在不同样本量下的势函数powerfunctionwithdifferentsamplenumber0.99970431.00.99012630.80.60.4ppois(8,7*lambd)c=8,alpha=0.22,n=70.2c=22,alpha=0.22,n=200.001234lambd例算得P0.049747250.052005.Remark2(n)分布的概率密度为ny11y2e2,y0nnf(y)22()20其他.当n=2,y1e,2y0fy()21()0其他.Back§非参数统计知识
7、回顾势函数(检验的势)无偏检验经验分布检验的相对效率无偏检验•引入无偏检验的目的是什么?好的检验应该是功效越大越好,能找出一致最大功效的否定域当然好,可惜这种否定域难得存在.比“一致最大功效”较弱的要求是“一致最大功效无偏”。•什么是无偏检验?无偏检验如果一个检验不犯第二类错误的概率不小于第一类错误的概率(即1()),称这样一类检验为无偏检验。定义2.2设W表示一个检验的拒绝域,对一般的假设检验问题,如果,0,P(XW),,1则称该检验为无偏检验。局部最优势检验LMP§非参数统计知识回顾势函数(检