欢迎来到天天文库
浏览记录
ID:42828178
大小:39.50 KB
页数:4页
时间:2019-09-21
《研究生参加学术活动4》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、研究生参加学术活动考核及学术报告学院:学科:学号:姓名:20年2月*枠人学研究牛参加学术活动记录时间:2013.5.20地点:报告人:报告题目:纵向数据建模方法综述报告内容:统计分析方法是认识社会和自然现彖数量特征的重要工具,正确的统计分析能够帮助人们正确地认识事物客观存在规律性.医学科研和疾病防治工作也不例夕卜,每一种疾病不论发生、发展及转归,都冇各自的演变规律,如果能很好地了解和掌握这些规律,才能对各种疾病的预防起到干预和调控作用.目询在人群疾病预测中使用较多的方法有:广义线性冋归模型、基于生存分析的模型、基于时序分析的模型、灰色模型、基于随机过程分析的模型、边际模型、混合效应模型
2、及变系数模型.1广义线性回归模型广义线性回归模型(GeneralizedLinearModel,GLM)是线性模型的扩展,他根据因变量的不同乂分为儿个不同的冋归模型•如果结果变量是连续的,就称是多重线性回归模型;结果变量是二项分布的,就称Logistic回归模型;结杲变量是Poisson分布的,就称为Poisson冋归模型;结果变量是负二项分布时,就是负二项回归模型等等.实际小的Logistic[Hl归模型应用较为广泛,几乎已经成了流行病学和医学中最常用的分析手段,实际中最为常用的就是二分类的Logistic回归模型[45].Logistic冋归模型的主要用途:(1)寻找危险因素,以疾
3、病发生与否作为结果变量,寻找某一疾病的危险因素等.(2)预测,建立LogisticlH
4、归模型Z后,可以根据模型预测在不同的自变量情况下人体发病或病情进展的概率.(3)判别,实际上跟预测类似,根据Logistic模型判断某人所患所病或进展概率有多大,也即看这人冇多大的町能性是属于某病.2000年至今不少研究者以回顾性为主,使用Logistic回归模型对肺癌,尤具是非小细胞肺癌(NSCLC)的危险因索进行单因索和多因素分析并给出各个因素的影响权重.Logistic回归模型在应用的时候有几点注意事项:(1)它要求齐个观察对象相互独立,因此不适用于遗传性疾病或者家族聚集性疾病的发病因素的研究
5、.(2)它要求样本容量应该是自变量个数的5〜10倍.更严格的要求认为反应变量各个水平中,例数最少的水平样木容量应该为自变量个数的5〜10倍.分析发现,该模型能满足NSCLC随访数据建模的要求.2基于生存分析的预测模型在冋归模型屮,通常都是自变量与结果变量之间以线性或者非线性形式建立回归关系.但是在生存分析屮,由于生存时间存在删失数据,难以直接与影响生存的因索以某种非线性形式建立回归关系.基于生存分析的模型冇很多,1972年英国D.R.Cox提出了半参数方法——Cox比例风险模型,Cox模型是生存分析中较为重要的一种数学模型.Cox比例风险模型是冃前国外肿瘤疗效评价和预后因素分析中最受欢
6、迎的多因素分析方法之一,MSKCC提出的Nomogram也是在进行多因素的Cox分析的基础上进一步建立复发率预测模型跑.随着计算机使用的日益推广,国内也已开始将Cox模型作为生存分析的重要模型•屮山医科大学骆福添教授从1991年起使用Cox比例风险模型对肿瘤预后因素进行分析,并利用回归系数计算预后指数,建立预后指数分级标准,并最终建立可应用于个体风险预测的数学模型・2009年山东大学附屈医院丛蕾等人利用Cox比例风险模型分析晩期NSCLC化疗预后因索.在使用Cox比例风险模型的时候有一个重要的假设,假设风险函数的比值不随时间的改变而变化,即假设要求每个个体的协变量的值在随访过程中保持不
7、变,这对于NSCLC患者随访数据集是难以作到的.3基于时序分析的模型时序分析方法中较为成熟的模型是自冋归移动平均(ARMA)模型,但它应用的前提是疾病资料为平稳序列.由于多数医学疾病现象都不太平稳,故其改进的ARIMA模型较为常用,它将川寸刻的观测看成是f吋刻前观测值的函数,即用r吋刻前的值预测当前的结果变量的值.2005年南京医科大学的陈勇、陈建国等人采用ARMIA模型拟合江苏省启东市1972〜2001年肺癌发病资料,并预测了该地区到2015年的肺癌发展趋势•结果表明ARIMA模型能较好地预测传染病发病率的变化趋势.但对于要研究的针对个体病情的进展情况的建模,这种方法不太适用.4灰色
8、预测模型目前使用较多的灰色预测模型是关于序列预测的一个变量、一阶微分的GM(1,1)模型.该模型是基于随机的原始时序数据,随吋间新到吋序呈现的规律可用一阶线性微分方程的解来逼近•文献用这个模型对肿瘤死匸率和各种疾病的发病率进行预测,未见冇基于此方法对患者个体随访数据进行病情进展预测的报道.对于同一个体,在时间上相近的观测Z间会比相距较远的观测表现出更紧密的联系,即观测值间具有一定和关延续性,因此纵向数据的时间先后顺序对于建模分析推断有着重要的意
此文档下载收益归作者所有