欢迎来到天天文库
浏览记录
ID:54369026
大小:788.92 KB
页数:5页
时间:2020-04-30
《右删失数据风险函数直方图估计.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第30卷第1期统计与信息论坛2015年1月Vol.30No.1Statistics&InformationForumJan.,2015【统计理论与方法】右删失数据风险函数直方图估计乔舰,李再兴(中国矿业大学(北京)理学院,北京100083)摘要:鉴于生存分析中风险函数较生存函数更能反映生存数据内在失效机制,基于累计风险函数的Nel‐son‐Aalen估计量,构造了右删失数据风险函数的新直方图估计量,并对该估计量的偏差、方差、积分均方误差等统计性质进行了论证,对该估计量的使用注意事项进行了说明,通过数值模拟进一步说明了新估计量的合理性。关键词:右删失数据;风险函数;直方图估计中
2、图分类号:O212∶F840.323文献标志码:A文章编号:1007-3116(2015)01-0014-04但其却以简单、易算、直观、易懂等特点在密度函数一、引言[4]估计、数据分析等过程中为应用者所广泛接受。风险函数是生存分析学科两大基础函数(生存函数、风险函数)之一,是刻画生存时间统计性质的重要特征之一,本质上是一个条件生存率而非概[1]94-95率。尽管通过数学解析的方式可以说明风险函数与生存函数本质上是相互唯一确定的,但由图1可知,风险函数比生存函数更能反映生存数据内在的失效机制,因此,对风险函数的研究成为生存分析最为重要的研究方向之一。而由于失访、意外事故或到研究
3、结束时仍存活等原因,某些研究对象确切的失效时间无法得到,只知其发生在某个特定的时间之后的右删失现象成为生存数据重要特征之一。右删失数据风险函数的非参数估计一直是统计热点问题。由于风险函数与密度函数的非参数估计在理论证明上的相通性,所以从事密度函数估计的统计学者一般都会将其在密度函数估计上的研究进展应用到风险函数估计上来,进而密度函数和风险函数的非参数估计在研究进展上几乎是同步图1不同类型生存函数与对应风险函数图[2-3]的。但是,这些研究基本上都基于核原理,基于尽管基于直方图原理的右删失数据风险函数估直方图理论的并不常见。相对基于核原理的估计方计不如相应的基于核理论的估计那样
4、具有理论性质法,尽管基于直方图理论得到的估计结果相对粗糙,的吸引力,但其确实提供了一种简洁有效展示生存收稿日期:2014-08-23;修复日期:2014-10-05基金项目:国家自然科学基金项目枟随机效应混合模型的统计推断枠(11001267)作者简介:乔舰,男,山东肥城人,经济学博士,讲师,研究方向:风险管理;李再兴,男,安徽安庆人,理学博士,副教授,研究方向:统计学。14乔舰,李再兴:右删失数据风险函数直方图估计2数据特征的方式。Regina与Ryzin基于风险函数O(h),也就是说本文给出的估计量并非对应风险的分式定义,提出了基于最近邻理论的密度函数直函数的无偏估计量,
5、且偏差随窗宽h的增大而增大,方图估计量和经验生存函数估计量相除的估计方只有当待估计点t处于取值区间Bj的中点时估计偏[5]法。Patil与Bagkavos提出了基于寿命表估计理差才为零。[6]论的风险函数估计方法。本文在风险函数整式定证明:令i表示从Υ研究开始到ti时刻的死亡删义基础上基于累积风险函数的Nelson‐Aalen估计量失信息历史记录。若i已知,则Υti时刻面临死亡风构造了新的右删失数据风险函数直方图估计量。险个体数目ni为可知常数,ti时刻死亡个体数目di服从B(ni,i),其中i为πti时刻面π临死亡风险个体二、右删失数据风险函数直方图在ti时刻瞬间死亡的概率
6、,即dii~B(ni,i)Υ,由估计量构造及其性质风险函数定义式(1)可知,i≈h(ti)Δt,从而π有:风险函数h(t)的基本定义为:di∑(j-1)h<ti£jhE(n)h(t)=limp(t≤T<t+Δt/T≥t)(1)E(h(t))=^iΔt→0+Δth形象地说,h(t)Δt测度了确诊后生存时间为tdi∑(j-1)h<ti≤jhE(E(ni))Υi的病人在较短时间区间(t,t+Δt)内死亡的渐近=h概率。jht∑h(ti)Δth()d若定义累计风险函数H(t)=h(x)dx,则:(j-1)h<ti≤jh∫(j-1)h∫0≈≈hhhhjh2H(t+)-H(t-)(-t)
7、′2′2∫[h(t)+(-t)h(t)+h()]dμh(t)=H(t)=lim(2)(j-1)h2h→0+h=h基于累计风险函数H(t)的Nelson‐Aalen估计12′=h(t)+h(t)((j-)h-t)+O(h)di2量H(t)=∑ti≤tn,t>t1,其中ni为^ti时刻处于死idi亡风险的个体数目,d性质2Var(h(t))≈∑(j-1)h<ti≤jh22,也就^i为ti时刻死亡个体数目。若将nih待估风险函数对应时间轴[0,T]等间隔划分为m个是说本文给出估计量的方差随窗宽h的增大而减区间
此文档下载收益归作者所有