资源描述:
《基于信息熵的决策树在慢性胃炎中医辨证中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第二军医大学学报2004Sep;25(9)AcadJSecMilMedUniv·1009··论 著·基于信息熵的决策树在慢性胃炎中医辨证中的应用11312112徐 蕾,贺 佳,孟 虹,王忆勤,贺宪民,范思昌,郎庆波(1.第二军医大学卫生勤务学系卫生统计学教研室,上海200433;2.上海中医药大学基础医学院,上海200032)[摘要]目的:探讨基于信息熵的决策树在慢性胃炎中医辨证分型中的应用。方法:采用bootstrap方法对406例样本进行扩增以满足数据挖掘对样本量的要求,采用基于信息熵的决策树C4.5算法建立中医辨证模型。结果:决策树C4.
2、5算法筛选出对中医辨证分型有意义的26个因素并对其重要性进行排序;产生清楚易懂可用于分类的决策规则;建立辨证模型,模型分类符合率为:训练集83.60%,验证集80.67%,测试集81.25%;模型区分各类证型的灵敏度和特异度也较高。结论:决策树C4.5算法建立的模型效果较好,可应用于慢性胃炎中医证型的鉴别诊断。[关键词]信息熵;决策树;中医;数据挖掘[中图分类号]R259.733;R311[文献标识码]A[文章编号]02582879X(2004)0921009204Applicationofdecisiontreebasedonentropyi
3、ntraditionalChinesemedicinesymptomanalysisofchronicgastritis11312112(1.DepartmentofXULei,HEJia,MENGHong,WANGYi2Qin,HEXian2Min,FANSi2Chang,LANGQing2BoHealthStatistics,FacultyofHealthServices,SecondMilitaryMedicalUniversity,Shanghai200433,China;2.SchoolofPreclinicalMedicine,Sh
4、anghaiUniversityofTraditionalChineseMedicine,Shanghai200032)[ABSTRACT]Objective:ToexploretheapplicationofdecisiontreebasedonentropyintraditionalChinesemedicine(TCM)symptomanalysischronicgastritis.Methods:Bootstrapmethodswereusedtomultiply406casesfordatamining,andmodelsforTCM
5、symptomwerebuiltusingdecisiontreeofC4.5.Results:Twenty2siximportantfactorswereselectedandrankedaccordingtotheimportance;readablediagnosticruleswereproducedandamodelwasbuilt,ofwhichthecorrectlyclassifiedrateoftrainingset,validationsetandtestsetwere83.60%,80.67%and81.25%,respe
6、ctively.ThesensitivityandspecificityofthemodeltodifferentiatetheTCMsymptomwasgood.Conclusion:ThemodelbuiltbyC4.5issatisfactoryandcanbeusedfordifferentiatingdiagnosisofchronicgastritiswithTCMsymptom.[KEYWORDS]entropy;decisiontree;traditionalChinesemedicine;datamining[AcadJSec
7、MilMedUniv,2004,25(9):100921012]X 中医对于慢性胃炎有很好的疗效,但是如何从特征:(1)指标多,指标间关系复杂;(2)88项指标中已积累的临床资料中提炼出蕴含的信息,并结合已存在计量、两分类、多分类、等级4种量度;(3)部分[1]有的中医辨证准则确定慢性胃炎患者的中医证指标(年龄、体质量等)存在缺失值;(4)应变量(即本型,以达到辨证施治目的便成为中医研究者颇为关次分析的目标变量)是多分类名义型指标。注的问题。本文尝试将数据挖掘决策树技术用于慢1.2 方法 本研究采用数据挖掘技术中的决策树性胃炎中医证型的分类,以
8、考察这一方法用来解决方法,构建以信息熵减少为特征的决策树分类模型,此类问题的效果。整个过程在SAS8.2EnterpriseMiner(以下简称SAS