树模型在慢性乙肝与肝硬化和肝癌临床诊断中的应用

树模型在慢性乙肝与肝硬化和肝癌临床诊断中的应用

ID:43966788

大小:41.00 KB

页数:7页

时间:2019-10-17

树模型在慢性乙肝与肝硬化和肝癌临床诊断中的应用_第1页
树模型在慢性乙肝与肝硬化和肝癌临床诊断中的应用_第2页
树模型在慢性乙肝与肝硬化和肝癌临床诊断中的应用_第3页
树模型在慢性乙肝与肝硬化和肝癌临床诊断中的应用_第4页
树模型在慢性乙肝与肝硬化和肝癌临床诊断中的应用_第5页
资源描述:

《树模型在慢性乙肝与肝硬化和肝癌临床诊断中的应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、树模型在慢性乙肝与肝硬化和肝癌临床诊断中的应用作者:王剑,刘殿武,曹国玉,李伟勇,李金奎【摘要】目的:利用决策树模型挖掘常见的临床检验资料信息,进一步提高慢性乙型肝炎及相关疾病的确诊率.方法:将临床收集的102例慢性乙肝患者和80例肝癌及肝硬化患者常见的17种信息和临床检测结果综合分析,利用决策树卡方自动交互探测(CHAID)和分类与回归树(CRT)两种算法构建预测模型,并采用止确预测率和交互卬证对其进行风险评估.结果:进入CHAID和CRT两种算法模型的主要变量是年龄和胆红素指标及职业等,两模型预测慢性乙型和肝炎肝硬化及

2、肝癌的总体准确率分别为71.4%和74.2%.结论:决策树模型在数据挖掘,资料再利用方面效果良好.【关键词】肝炎,乙型;决策树;诊断0引言在已知各型肝炎中,乙型病毒性肝炎的危害最严重[1]・乙型病毒性肝炎极易发展为肝硬化、肝癌,因此如何早期诊断并加以区分具有重人的临床意义.口前肝硬化及肝癌的诊断主要依赖于血清学和影像学检测等,而金标准肝脏穿刺的使用多受限制[2-3].在目前尚无特异性生物标志的情况下,充分利用现有的临床检测结果,通过高效的统计方法,挖掘数据内在的信息以提高诊断准确性,是目前较为可行的方法之一[4-5].本研

3、究试图利用决策树模型在此方面做有益的探索.1材料和方法1.1材料收集200703/200705河北省石家庄市传染病医院的部分住院患者182例,其中慢性乙肝102例,肝癌及肝硬化者80例.以上病例均符合国家200512制定的《慢性乙型肝炎防治指南》的诊断标准,并排除合并其他型别的感染[6-7],部分病例经过肝脏穿刺病理证实,肝癌患者全部经病理证实.1・2方法1.2.1数据来源乙型病毒性肝炎患者的病毒DNA定量采用适时荧光PCR方法,乙肝5项检测采用酶免疫法,肝功能等检测采用常规生化方法•数据采集均符合医学伦理学要求.1.2.

4、2统计方法模型构建利用SPSS15.0统计软件,决策树研究共有4种不同算法,本次研究采用卡方自动交互探测(chisquaredautomaticinteractiondetection,CHAID)和分类与回归树(classificationandregressiontree,CRT)两种算法对各变量进行预测,因为CHAID可以进行多分类结点划分,CRT只能进行二分类结点划分,具有一定代表性.自变量的重要性依据对应变量反应程度的人小依次排列,结点划分水准定为0.05.研究变量的赋值情况如表1.表1各研究变量赋值明细表(略)

5、2结果2・1患者资料基本情况收集的182例乙型肝炎患者中男性118例(64.8%),女性64例(35.2%),年龄12〜76(45.4±8.7)岁.2.2决策树模型汇总不同算法下乙型病毒性肝炎和肝硬化及肝癌诊断决策树主要技术指标见表2.表2慢性乙型肝炎与肝硬化及肝癌诊断决策树(略)2.3决策树模型依以上技术指标,用CHATD和CRT两种算法构造树模型图分别见图1,2.其中CIIAID模型的预测变量分别是年龄、胆红索水平和职业等因索,按目标效应响应率从高到低的顺序排列(即出现肝硬化和肝癌的危险性高低),分别为结点6(87.5

6、%),结点5(54.5%),结点7(51.2%),结点4(18.4%)和结点1(13.9%),即在基本条件满足的情况下,年龄大于51岁,职业为农民或个体者,患肝硬化和肝癌的危险性最高.而CRT模型的预测变量则是胆红素水平和年龄,按目标效应响应率从高到低的顺序排列(即出现硬化及肝癌危险性高低),分别为结点4(74.6%),结点3(36.1%),结点1(14.8%),即当胆红素水平高于14.3,同时年龄大于47.5岁者,患肝炎肝硬化及肝癌危险性最大.图1慢性乙型肝炎和肝硬化及肝癌的诊断决策树形图(CHAID)(略)图2慢性乙型

7、肝炎和肝硬化及肝癌诊断决策树形图(CRT)(略)2.4决策树模型的分类评价和风险评估用CHAID和CRT两种算法构建的决策树模型,可将不同特征的患者预测为相对应的目标,其正确分类分别达到71.4%和74.2%(表3),说明模型的拟合效果良好.交互印证的风险评估表明,CHAID和CRT两种模型的风险分别为0.451和0.352,标准误为0.037和0.035,虽在可接受范围内,但前者稍高,有一定风险.表3慢性乙型肝炎与肝硬化及肝癌诊断决策树模型的分类(略)注:括弧内、外分别是CRT和CHAID算法.3讨论乙型肝炎患者极易发展

8、为肝硬化及肝癌,而早期肝硬化和肝癌因临床症状不典型,常常被患者忽视,直到中晚期才被发现,临床治疗十分被动.本研究试图对常规临床监测数据进行挖掘,以发现隐含的、有预测价值的信息,达到早期预警[8-9].决策树模型构建一般有4种算法,CRT和QUEST算法得到的树结构模型每个结点有2个分支,称为二叉树.CH

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。