非参理论部分

非参理论部分

ID:27822818

大小:195.38 KB

页数:9页

时间:2018-12-06

非参理论部分_第1页
非参理论部分_第2页
非参理论部分_第3页
非参理论部分_第4页
非参理论部分_第5页
资源描述:

《非参理论部分》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、“非参数统计”课程试验材料一:摘要:本文通过一个生存分析模型来比较其在参数模型、半参数模型和非参数模型假设下的估计问题,并通过模拟分析评价这三种模型假设,使学生对这三种常见的统计模型有较为直观的认识。作为“非参数统计”的导入教学研究,希望学生初步认识非参数统计方法,弥补教材屮只列举非参数检验方法的不足。关键词:半参数,非参数,Cox模型,部分似然,Kaplan-Meier估计AMS(2000):62F10,62G50,62N021.引言所谓参数估计和假设检验就是假设随机变量的分布函数形式已知,而含有未知参数的统计模型,需要我们从母体中抽取一定数量的样本,构造一个合适的统计

2、量来估计未知参数或者对未知参数做出某种假设推断。而非参数估计或者检验在统计推断的时候不需要假设母体的任何分布形式,在此基础上对母体做岀某种推断(估计或检验),例如经验分布函数和非参数检验方法。介于参数模型和非参数模型之间的就是所谓半参数模型,它意味着随机变量的模型假设中,分布函数的形式已知,但是分布函数中既含有参数部分,又含有待估的函数部分(称此部分为非参数部分),FI前研究得比较多得是半参数回归模型。众所周知,如果能确信未知的母体的分布来自于一个参数模型,那么由此得到的统计推断就会有比较高的有效性;但是要确信母体的真实分布不是一件容易的事情,需要专业知识和丰富的经验。就

3、非参数推断而言,因为不需要我们对母体做过多的分布假设,所以推断结果具有较好的稳健性,但是其有效性就会差一点。半参数统计介于上二者之间,既能保证一定的有效性有具有一定的稳健性,得到了统计学者的推崇。本文第二节,我们将说明本文所使用的生存分析模型。第三、四、五节我们分别研究模型在参数假设,半参数假设和非参数假设下的估计问题,同时也研究相应估计的若干性质。第六我们分别进行一个小的模拟计算来对比上述的估计方法。2.模型假设生存分析是近二三年来发展起来的一个数理统计分支,它是根据现代医学、生物学、工程科学等科学研究的大量的实际问题提出来的,着重对删失数据进行统计分析的一门科学。生存

4、分析的理论与应用受到了世界各国,特别是发达国家的广泛重视。1986年美国国家科学院把生存分析列为六大发展方向,其原因就在于它概括了很多其他应用领域,例如社会学、心理学、经济学,保险精算学等等⑵.生存分析就是根据试验或者调查所得的数据,对生物和人的生命时间、或者寿命进行分析和推断。这里的“生命”或者“寿命”应做广泛的理解,乃是自然界、人类社会或工程技术过程中某种状态的持续时间。生存分析含有许多实用的方法和丰富的理论,随着医疗实践和工程实践及其它领域活动的推动,将不断有新的统计方法出现你应用范围也将越来越广泛[2]。在牛物学、医学和可靠性研究中,我们需要常常对生存函数进行比较

5、。例如在试验室研究中需要比较在致癌物环境下的两组或者更多组老鼠的无肿瘤持续时间,而这些老鼠的无肿瘤持续时间可能还和其他因素有关,例如,年龄,个体大小等等,这说明老鼠的无肿瘤持续其似乎还应该和一些外部或者内部的其他因素有关。为了研究这类数据,Cox⑶于1972年提出了所谓比例失效率模型(proportionalhazardsmodel),现在人们称之为Cox模型,它把协变量兀(covariate)引入到失效率函数内,提出模型:A(z)=人)(r)exp(x70),(2.1)其中0=是回归系数向量,&)(/)称之为基本失效率函数(baseline)・失效率函数2(/)=lim

6、丄P(r

7、T>r),又称之为危险率函数。假设随机Ar变量T有密度函数/(/),我们于是有伽=上—型=也(2.2)1-F⑴S(t)S(t)t或者S(/)=exp(-,而且满足j=o此处F(f)是相应于密度oo函数f(t)的分布函数,S(0=P(T>t)=l-F(t)称为生存函数(survivaltfunction)«一般记A(r)=j^{s)ds,称为累积危险率函数(accumulativehazardsofunction)o在生存分析中,我们常常会遇到这类数据:灯泡在长达500小I]寸的寿命试验屮仍然没有损坏;吃了致癌药物的小口鼠到100天后还无明显反应等等。这

8、些数据的共同特点是我们无法知道这些数据的确切值,只知道它大于某一个数。在生存分析中,称这些数据被右删失(rightcensoring).于是我们可以建立以下的生存分析模型:假设…卫是生命数据,代表n个人的寿命,G,…,C”是删失变量,而我们只能看到X二min(7;,G),i=l,2,・・F。记删失因子为6=I(T〔CJ,于是我们得到的观测数据集合就是:{冷@}二,生存分析的主要目的Z—就是在上述观测数据的基础上来推断生存函数S(/)o1.参数统计分析我们知道模型(2.1)是一个半参数模型,其中exp(*0)是参数部分,待估的参

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。