欢迎来到天天文库
浏览记录
ID:32723017
大小:5.64 MB
页数:63页
时间:2019-02-15
《基于数据挖掘技术肿瘤标志蛋白芯片在肺癌辅助诊断中应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘委摘要目的肺癌是一种严重危害人类健康和生命质量的恶性肿瘤,其发病率及死亡率近年来逐步上升、居高不下,如今已成为誊今世界范围内最常见的恶性肿瘤之一。近年来肺癌的诊疗技术快速提高,然聪因肺癌翠期无特异性l瞄床症状,一般不会弓
2、起患者重视,且临床缺乏对于离危人群的有效早期诊断方法,因褥当患者有典型临床表现再就诊时,大多已属于晚期,所以临床治疗效果和预后都不令人满意。因此探讨及发展早期发现、早期诊断的有效方法,对于改善肺癌患者的治疗和预后与患者的健康及生命质量都有着重要的意义。血清肿瘤标惑的检测是近年来新兴的辅助诊断肿瘤的常用方法之一,对肺癌的诊断、病情进展和疗效的观察等都有极
3、大的价值。并且该方法具有检测结果定量客观、创伤小、标本易获得、可重复测定等优点。然薅由于丑前并未发现肺癌的特异性血清肿瘤标志,故有假阳性和假阴性的问题,为改善这一问题及提高对早期恶性肿瘤的阳性检出率,临床多采用多种肿瘤标志联合检测。血清舯瘸标志的联合检测的确能提供许多信息,然而也带来大量的参数,用一般的统计学手段很难做出芷确的处理。决策树是用以提取数据内在规律并对新数据对象进行分类预测,其模型的灵敏度、特异度较高,便于临床证候诊断时的实际操作。人工神经网络(趟州)是应用与大脑神经突触联接的结构类似的模型对数据及信息进行处理的一种运算模型,可以很容易的解决具有大量参数的闯题
4、,为解决大复杂度问题提供了一种相对来说比较简单且有效的方法。本研究威用蛋白芯片检测技术分别测定血清中CAl99、NSE、CEA、CA242、Ferritin、AFP、CA董25、HGH和CAl539项肿瘤标志的水平。将上述肿瘤标志利用新型数据挖掘技术和传统的统计学分类技术,抽取可用于肺癌辅助诊断的有效特征,建立决策树、人工神经网络、Fisher判别分析、二项Logistic回归分析4种适合的模型,探讨这几种模型对肺癌辅助诊断的特异度、灵敏度、准确度、阳性预测僮、阴性预测值,并通过ROC蓝线筛选最优模型,为实现肺癌的快速辅助诊断、改善肺癌治疗及预后打下良好基础。对象与方法摘
5、要1.样本2010年6月至2011年重2月予郑州大学第五附属医院呼吸内科及肿瘤科,收集有肿瘤标志鬣白芯片检测结果的肺癌患者202例、肺鼠性疾病患者201例。所有样本经过细胞学或病理学诊断。2。血清肿瘤标志的裣测采用浙江湖州数康生物科技有限公司生产销售的肿瘭标志定量检测试剂盒测定赢清中Ferritin,AFP、CEA、NSE、CAl99、CA242、CAl25、CAl53和HGH9项肿瘤标志的水平。3.建立模型随机选取所有蓍巾癌、腺良性的75%作为训练集(肺癌、肺良性各150例),分别用决策树、入工神经网络、Logistic酸归和Fisher判别分析建立含适的模型,然后用所
6、有样本作为预测集(肺癌202例,肺良性201例)检测模型优劣。用缔检实验的评价指标和ROC曲线比较4种模型对预测集样本的预测效果。4.统计学分析采用SPSSl2.o和Clementinel2.0软件。定量资料墩翔菲参数检验的两独立样本捡验,用中佼数和四分位数表示结果;定性资料比较用矿检验;检验水准a如.05。结果1.9项血清肿瘤标志中,肺癌组CAl53、Ferritin、CEA、NSE、AFP、CAl25、CA242水平显著高于舯良性疾病组,差器具有统计学意义(P7、中的表达阳性率差异有统计学意义(尹《o.05)。2.4种模型分类结果决策树模型结果:灵敏度为92.08%、特异度为92.54%、阳性预测值为92.54%、阴性预测值为92.08%,对预测集分类的准确度为92。3l%,RUC为0。923。ANN模型结果:灵敏度为83.66%、特异度为88.56%、阳性预测值为88.02%、阴性预测值为84.36%,此模型对测试集分类的准确度为86。10%,RUC为0.861。二项Logistic回归模型结果:灵敏度为75.74%、特异度为86.07%、阳性预测值为84。53%、阴性预测值为77.93%,此模型对测试集分类的准确度为80.898、%,RUC为0.809。Fisher判别分析结果:灵敏度为63。86%、特异度为89。05%、阳性预测值为85.43%、阴性预测值为71.03%,此模型对测试集预测分类的准确度为76。43%,RUC为0.765。ll摘要结论1.利用数据挖掘技术联合多肿瘤标志蛋白芯片建立的模型可以快速鉴剐诊断肺癌和肺良性疾病。:2.决策树和人工神经网络模型对肺癌和肺良性疾病的鉴别诊断效果优于Fisher判剐分析和二项Logistic回归模型,其中决策村鉴别诊断效果最优。关键词:数据挖掘决策树肺癌肿瘤标志辅助诊断IllAbstractObject
7、中的表达阳性率差异有统计学意义(尹《o.05)。2.4种模型分类结果决策树模型结果:灵敏度为92.08%、特异度为92.54%、阳性预测值为92.54%、阴性预测值为92.08%,对预测集分类的准确度为92。3l%,RUC为0。923。ANN模型结果:灵敏度为83.66%、特异度为88.56%、阳性预测值为88.02%、阴性预测值为84.36%,此模型对测试集分类的准确度为86。10%,RUC为0.861。二项Logistic回归模型结果:灵敏度为75.74%、特异度为86.07%、阳性预测值为84。53%、阴性预测值为77.93%,此模型对测试集分类的准确度为80.89
8、%,RUC为0.809。Fisher判别分析结果:灵敏度为63。86%、特异度为89。05%、阳性预测值为85.43%、阴性预测值为71.03%,此模型对测试集预测分类的准确度为76。43%,RUC为0.765。ll摘要结论1.利用数据挖掘技术联合多肿瘤标志蛋白芯片建立的模型可以快速鉴剐诊断肺癌和肺良性疾病。:2.决策树和人工神经网络模型对肺癌和肺良性疾病的鉴别诊断效果优于Fisher判剐分析和二项Logistic回归模型,其中决策村鉴别诊断效果最优。关键词:数据挖掘决策树肺癌肿瘤标志辅助诊断IllAbstractObject
此文档下载收益归作者所有