基于关联规则和决策树的中医胃炎诊断分析论文

基于关联规则和决策树的中医胃炎诊断分析论文

ID:10450522

大小:54.00 KB

页数:4页

时间:2018-07-06

基于关联规则和决策树的中医胃炎诊断分析论文_第1页
基于关联规则和决策树的中医胃炎诊断分析论文_第2页
基于关联规则和决策树的中医胃炎诊断分析论文_第3页
基于关联规则和决策树的中医胃炎诊断分析论文_第4页
资源描述:

《基于关联规则和决策树的中医胃炎诊断分析论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于关联规则和决策树的中医胃炎诊断分析论文.freelinsup)和最小置信度(minconf)的关联规则。关联规则有如下优点:可以产生清晰有用的结果;支持间接数据挖掘;可以处理变长的数据;计算的消耗量是可以预见1。经典的关联规则挖掘算法2有:Apriori算法3、抽样算法、DIC算法。1.1Apriori算法简介Apriori算法先根据最小支持度,计算所有的1-项集(k-项集是含有k个项的项集),记为C1。找出所有满足支持度条件的1-项集,记为L1。然后根据L1确定候选2-项集的集合,记为C2。

2、从C2找出所有满足支持度条件的2-项集,记为L2。依此类推,直到不再有候选项集。1.2基于辨证“中虚气滞”关联规则的实验设计我们首先根据“疾病标准表”、“中医临床诊疗术语”和南京中医药大学提供的“中药材表”,对病历中出现的症状、辨证与处方进行规范化,将词义相同或相近的整理归类,统一、减少或简化其称谓,消除别名。比如,面色中既有“面黄少华”又有“面色萎黄”,将其统一纠正为“面色萎黄”。然而,用文字描述的数据不利于计算机接收和处理,用数字来表达可以大大简化工作的复杂度。我们采用数值化的方法来体现某一症

3、状的有无,将症状看成是布尔变量。我们从中医胃炎病历中筛选出辨证为“中虚气滞”的病历,利用关联规则的Apriori算法来探求症状与此辨证之间的关系。我们根据中医胃炎病历中所涉及到的症状、辨证、处方等数据,在ACCESS中构建数据库及相应的表。其中sample表(见表1)中存放的是样本数据,即中医病历中辨证为“中虚气滞”的病历。这里的每条记录代表辨证为“中虚气滞”的一条病历,分别由不同的症状构成。Symptom表(见表2)中存放的是中医胃炎病历中所涉及到的所有症状名称及其相应的编号。表1sample表

4、(略)表2symptom表(略)利用VC6.0作为开发平台,从运行界面上输入支持度和辨证“中虚气滞”所涉及到的症状数目,根据Apriori算法运行程序,最后得到辨证“中虚气滞”与症状之间的关系。1.3基于辨证“中虚气滞”关联规则的实验结果分析关联规则有两个评价标准:支持度和置信度。置信度描述的是包含A和B的事务数与包含A的事务数的百分比。由此可见,置信度度量规则的强度是我们关注的重点。以男性病历为例,最后得到最大频繁项集是{胃脘痞胀,舌苔薄(白),吞酸或泛酸,舌质红},以下列举部分结论以供分析。置

5、信度:舌苔薄(白)=中虚气滞(50%);舌质红=中虚气滞(66%);胃脘痞胀∧舌苔薄(白)∧吞酸或泛酸∧舌质红=中虚气滞(100%)。置信度表明:只有舌苔薄(白)这一症状时,辨证为“中虚气滞”的概率是50%;只有舌质红这一症状时,辨证为“中虚气滞”的概率是66%;症状胃脘痞胀,舌苔薄(白),吞酸或泛酸,舌质红同时出现的前提下,辨证为“中虚气滞”的概率是100%。由女性病历分析,得到症状的两个最大频繁项集是{舌苔薄(白),脉细弦,口干(欲饮),胃脘隐痛}和{舌苔薄(白),脉细弦,胃脘嘈杂,舌质淡},

6、以下列举部分结论以供分析。置信度:舌苔薄(白)=中虚气滞(22.2%);脉细弦=中虚气滞(25%);胃脘隐痛=中虚气滞(40%);口干(欲饮)=中虚气滞(66.7%);舌苔薄(白)∧脉细弦=中虚气滞(25%);胃脘隐痛∧舌苔薄(白)=中虚气滞(50%);脉细弦∧胃脘隐痛=中虚气滞(66.7%);脉细弦∧胃脘隐痛∧舌苔薄(白)=中虚气滞(66.7%);舌苔薄(白)∧脉细∧口干(欲饮)∧胃脘隐痛=中虚气滞(100%);舌苔薄(白)∧脉细∧舌质淡∧胃脘嘈杂=中虚气滞(100%)。由实验结果可知,在单个症

7、状出现的情况下,症状口干欲饮对于辨证“中虚气滞”的影响最大;当两个症状同时出现的情况下,症状脉细弦和胃脘隐痛能导致是辨证“中虚气滞”的可能性为66.7%,是其他几种两个症状同时出现的可能性中最大的。当同时出现舌苔薄(白)、脉细、口干(欲饮)、胃脘隐痛和舌苔薄(白)、脉细、舌质淡、胃脘嘈杂这2组症状时,都可判断辨证是“中虚气滞”。由此可见,应用关联规则方法对中医胃炎病历进行分析确实能在一定程度上揭示辨证与症状对应的规律,从中提取有用知识,为临床及实验研究提供进一步探索的线索和目标。2基于决策树方法的

8、中医胃炎分析决策树算法是目前应用最广泛的归纳推理算法之一4,是一种逼近离散值函数的方法,通常用来形成分类器和预测模型2。决策树分类方法采用自顶向下的递归方式。从决策树的根到叶结点的一条路径就对应这一条合取规则,整棵决策树就对应着一组析取表达式规则。2.1ID3算法简介ID3算法先确定每一个实例属性单独分类训练样例的能力,将分类能力最好的属性选做树的根结点。然后为根结点属性的每个可能值产生一个分支,并把训练样例排列到适当的分支之下。重复整个过程,用每个分支结点关联的训练样例来选取在该

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。