基于信息熵的决策树在慢性胃炎中医辨证中的应用

基于信息熵的决策树在慢性胃炎中医辨证中的应用

ID:34057766

大小:272.71 KB

页数:4页

时间:2019-03-03

基于信息熵的决策树在慢性胃炎中医辨证中的应用_第1页
基于信息熵的决策树在慢性胃炎中医辨证中的应用_第2页
基于信息熵的决策树在慢性胃炎中医辨证中的应用_第3页
基于信息熵的决策树在慢性胃炎中医辨证中的应用_第4页
资源描述:

《基于信息熵的决策树在慢性胃炎中医辨证中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二军医大学学报2004Sep;25(9)AcadJSecMilMedUniv·1009··论 著·基于信息熵的决策树在慢性胃炎中医辨证中的应用11312112徐 蕾,贺 佳,孟 虹,王忆勤,贺宪民,范思昌,郎庆波(1.第二军医大学卫生勤务学系卫生统计学教研室,上海200433;2.上海中医药大学基础医学院,上海200032)[摘要]目的:探讨基于信息熵的决策树在慢性胃炎中医辨证分型中的应用。方法:采用bootstrap方法对406例样本进行扩增以满足数据挖掘对样本量的要求,采用基于信息熵的决策树C4.5算法建立中医辨证模型。结果:决策树C4.

2、5算法筛选出对中医辨证分型有意义的26个因素并对其重要性进行排序;产生清楚易懂可用于分类的决策规则;建立辨证模型,模型分类符合率为:训练集83.60%,验证集80.67%,测试集81.25%;模型区分各类证型的灵敏度和特异度也较高。结论:决策树C4.5算法建立的模型效果较好,可应用于慢性胃炎中医证型的鉴别诊断。[关键词]信息熵;决策树;中医;数据挖掘[中图分类号]R259.733;R311[文献标识码]A[文章编号]02582879X(2004)0921009204Applicationofdecisiontreebasedonentropyi

3、ntraditionalChinesemedicinesymptomanalysisofchronicgastritis11312112(1.DepartmentofXULei,HEJia,MENGHong,WANGYi2Qin,HEXian2Min,FANSi2Chang,LANGQing2BoHealthStatistics,FacultyofHealthServices,SecondMilitaryMedicalUniversity,Shanghai200433,China;2.SchoolofPreclinicalMedicine,Sh

4、anghaiUniversityofTraditionalChineseMedicine,Shanghai200032)[ABSTRACT]Objective:ToexploretheapplicationofdecisiontreebasedonentropyintraditionalChinesemedicine(TCM)symptomanalysischronicgastritis.Methods:Bootstrapmethodswereusedtomultiply406casesfordatamining,andmodelsforTCM

5、symptomwerebuiltusingdecisiontreeofC4.5.Results:Twenty2siximportantfactorswereselectedandrankedaccordingtotheimportance;readablediagnosticruleswereproducedandamodelwasbuilt,ofwhichthecorrectlyclassifiedrateoftrainingset,validationsetandtestsetwere83.60%,80.67%and81.25%,respe

6、ctively.ThesensitivityandspecificityofthemodeltodifferentiatetheTCMsymptomwasgood.Conclusion:ThemodelbuiltbyC4.5issatisfactoryandcanbeusedfordifferentiatingdiagnosisofchronicgastritiswithTCMsymptom.[KEYWORDS]entropy;decisiontree;traditionalChinesemedicine;datamining[AcadJSec

7、MilMedUniv,2004,25(9):100921012]X 中医对于慢性胃炎有很好的疗效,但是如何从特征:(1)指标多,指标间关系复杂;(2)88项指标中已积累的临床资料中提炼出蕴含的信息,并结合已存在计量、两分类、多分类、等级4种量度;(3)部分[1]有的中医辨证准则确定慢性胃炎患者的中医证指标(年龄、体质量等)存在缺失值;(4)应变量(即本型,以达到辨证施治目的便成为中医研究者颇为关次分析的目标变量)是多分类名义型指标。注的问题。本文尝试将数据挖掘决策树技术用于慢1.2 方法 本研究采用数据挖掘技术中的决策树性胃炎中医证型的分类,以

8、考察这一方法用来解决方法,构建以信息熵减少为特征的决策树分类模型,此类问题的效果。整个过程在SAS8.2EnterpriseMiner(以下简称SAS

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。