基于logistic回归模型对肝癌手术治疗效果的评价

基于logistic回归模型对肝癌手术治疗效果的评价

ID:33439768

大小:81.96 KB

页数:11页

时间:2019-02-26

基于logistic回归模型对肝癌手术治疗效果的评价_第1页
基于logistic回归模型对肝癌手术治疗效果的评价_第2页
基于logistic回归模型对肝癌手术治疗效果的评价_第3页
基于logistic回归模型对肝癌手术治疗效果的评价_第4页
基于logistic回归模型对肝癌手术治疗效果的评价_第5页
资源描述:

《基于logistic回归模型对肝癌手术治疗效果的评价》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于Logistic回归模型对肝癌手术治疗效果的评价河南城建学院第三届大学生数学建模竞赛承诺书我仔细阅读了《河南城建学院第三届大学生数学建模竞赛参赛须知九我完全明白,在竞赛开始后参赛者不能以任何方式(包括电话、电子邮件、网上咨询等)与任何人研究、讨论与赛题有关的问题。我知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我将受到严肃处理。

2、我的选择题号为:姓名系别学号联系方式(以下内容参赛同学不需填写,由竞赛组委会统一编码)评阅编号:河南城建学院笫三届大学牛数学建模竞赛编号专用页评阅编号(由组委会评阅前进行编号):题目:基于Logistic回归模型对肝癌手术治疗效果的评价摘要:首先,利用聚类分析根据10个指标对20个样本进行聚类,发现与预后影响的结果具有很大的偏差,故10个指标均不是对预后具有决定性的指标,具有权重性。再对10个指标对预后的影响进行聚类分析,发现x3(HbsAg),x9(肿瘤旁的微小子灶),x4(AntiHCV),xl()(术后腹水),x8(肿

3、瘤包膜)、x2(门脉癌栓),x7(肿瘤生长方式)具有相近性,即对预后的影响也许具有一致性。其次,利用判别分析各指标与预后影响的相关性,得到非标准化判别方程并用3个样本进行回带检验,准确率为66.7%,精确度和稳定性不够高,对现实的指导意义不怎么大。为提高精确度和稳定性,换用Logistic回归模型利用具有代表性的肝癌患者样本的10项指标建立回归方程,得到:无预后影响的准确率为90.9%,有预后影响的准确率为88.9%,总计百分比为90%,根据统计学原理,若预测率大于50%,预测的结果是良好的、较为准确的。至此,准确率比用判别

4、分析提高了23.3%,所以用Logistic回归模型对预后影响进行判断是有效的。关键词:聚类分析,判别分析,Logistic回归分析,肝癌预后影响,SPSS11问题重述肝癌手术治疗效果评价肝癌是我国笫二常见的癌症,很多人在发现肝癌时就已经是肝癌屮晚期了,而肝癌手术治疗是中晚期肝癌的首选疗法。选取某医院10年來肝癌病例总共4860例,每个病例有病人近80个信息,其中包括患者病历号、性别、年龄、学历、职业、住址、基本病史、临床体征、恶性肿瘤分类、实验室检验指标、影像学检查等,经过数据预处理,选取其屮20个有代表性的样本,选取对预

5、后影响的10个指标如附件1■预处理后样本数据,各指标项说明见附件2■各指标项说明。请以预后影响作为评价标准,建立数学模型,对手术的治疗效果进行预测,为病人是否选择手术治疗提供建议。2模型假设(1)在理想情况下,认为20个样本具有很强的代表性,即包含了不同重要指标所对应的预后影响。(2)不考虑各个样本之间的个体差异,即大致的身体健康情况相同,身体恢复能力也相同。(3)不考虑各个样本在术后的主观意志和客观条件如手术医师、病房条件、药物使用等的影响。(4)不考虑其他变量指标对预后的影响,不考虑其他变量指标对10个指标的交互影响。3

6、符号说明4数据预处理4.1医学数据意义翻阅大量医学专业书籍[1]、[2],可知相关变量指标的含义,如表2所示。4.2数据的初步分析4.2.1数据的初步统计利用Excel对选取的20个有代表性的样本及其各样本对预后影响的10个指标总表进行析:20个样本中有“预后影响叩勺有9例,无“预后影响”的有11例,所有样木详情的统计情况如表3所示。34.2.2数据剔除根据现代医学统计方法理论[3],所有样本量的各项指标从轻到重的分布应呈现正态分布图像[4],20个样本数据的10个指标的分布详情均比较准确。依据统计学原理,20个样本数据具有

7、一定的代表性,故不剔除任何数据。4.3对指标的赋值为方便建模时对各样本、各指标进行分析,故将各个指标的情况进行赋值,按照综合评价中指标值标准化方法的探讨[5],在模型中各项指标均为分类数据,为将分类数4据应用于数值模型中,因此对分类数据进行数值赋值。分别用数集{0,123}中的数字来表示各指标下的不同等级数据,且数集{0,1,2,31只是分类指示符,并无真正的数值含义,具体赋值情况如表4所示。5模型建立与优化求解5.1基于聚类分析分析源数据5.1.1聚类分析的基本方法聚类分析(ClusterAnalysis)[3]、[4]是

8、研究分类问题的多元统计方法Z—,就是根据研究对象的特征把性质相近的个体归为一类,按样本的“接近程度"使得同一类中的个体具有高度的同质性,不同类之间的个体具有高度的差异性的多元分析技术的总称。5.1.2聚类分析的大致过程系统聚类的步骤一般是首先根据一批数据或指标找出能度量这些数据或指标Z间相

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。