真实世界中医诊疗数据挖掘分析的探索与实践

真实世界中医诊疗数据挖掘分析的探索与实践

ID:43233247

大小:884.50 KB

页数:39页

时间:2019-10-05

真实世界中医诊疗数据挖掘分析的探索与实践_第1页
真实世界中医诊疗数据挖掘分析的探索与实践_第2页
真实世界中医诊疗数据挖掘分析的探索与实践_第3页
真实世界中医诊疗数据挖掘分析的探索与实践_第4页
真实世界中医诊疗数据挖掘分析的探索与实践_第5页
资源描述:

《真实世界中医诊疗数据挖掘分析的探索与实践》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、真实世界中医诊疗 数据挖掘分析的探索与实践张小平中国中医科学院2012.07.5一、数据挖掘概述二、真实世界中医诊疗数据挖掘的研究现状三、数据挖掘对真实世界中医诊疗数据的要求四、数据挖掘常用工具五、真实世界中医诊疗数据挖掘的思考主要内容一、数据挖掘概述数据挖掘(DataMining,DM)是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。分类或预测聚类关联规则序列模式等根据任务数据挖掘作为知识发现(KDD)的一个步骤[10]二、真实世界中医诊疗数据挖掘 的研究现状几千年来,中医临床实践积累了海量的真实世界中医诊疗数据

2、;东汉末年,医圣张仲景钻研和分析已有文献典籍(《素问》、《九卷》、《八十一难》、《阴阳大论》、《胎胪药录》等),并结合临床诊疗经验,利用古代数学等相关知识,得出了六经辨证模式,撰写出被后人称为辨证论治典范的著作《伤寒杂病论》,体现了现代数据挖掘技术的朴素思想[19];当今,利用先进的数据挖掘技术,在海量的真实世界中医数据中,发现启发性或可验证性的中医诊疗规律,将会对疾病的防御和治疗,对人们更好地了解中医的内涵以及促进中医的发展具有重要的现实意义。从上世纪90年代以来,随着数据挖掘技术的成熟和广泛应用,利用数据挖掘等先进的信息技术手段,总结名老中医诊疗经验、探索中医辨证论治规律已逐渐成为

3、国内中医领域的研究热点。利用聚类[46-55]、关联规则[56-65]、贝叶斯网络与贝叶斯分类[66-70]、SVM[71-73]、回归分析和判别分析[74-77]、神经网络[78-81]、Rough集[82-85]、文本挖掘[86-89]、复杂网络[90-91]、因子分析和主成份分析[92-94]、隐结构模型[95-102]、隐马尔科夫模型[106-108]、主体模型[109-114]等多种数据挖掘技术,广泛探索中医“辨证论治”的诊疗规律。二、真实世界中医诊疗数据挖掘 的研究现状聚类分析189个案例中半夏泻心汤7味中药聚成四类,各类药物的平均用量(g)[53]聚类结果示例[10]二、

4、真实世界中医诊疗数据挖掘 的研究现状聚类分析35个肾虚辨证因子聚类分析树状图[49]二、真实世界中医诊疗数据挖掘 的研究现状聚类分析3238例糖尿病数据中50个症状的部分分层聚类结果二、真实世界中医诊疗数据挖掘 的研究现状3238例糖尿病数据中50个症状聚类分析利用SPSS,对Breastcancer数据中的1207例数据进行K-means聚5类的结果二、真实世界中医诊疗数据挖掘 的研究现状应用聚类分析存在的问题二、真实世界中医诊疗数据挖掘 的研究现状参数选择问题聚类都涉参数选择问题。如,聚类数与距离函数(或密度函数)都需要人为设定,不同的参数设置通常会得到不同的聚类结果,尤其是面对高

5、维稀疏数据时,聚类结果受距离函数(或密度函数)的影响更为突出。中医在症状、证候和复方药物的描述中具有高维性和稀疏性特征。据我们对3000多例糖尿病数据统计得知,常用的症状或中药名称约500种,证候描述约1000多种。而每个患者描述的症状、中药与证候诊断约20种左右。应用聚类分析存在的问题二、真实世界中医诊疗数据挖掘 的研究现状v1v2v3……p110100p211000…中医临床数据特点v1v2v3……t150010000t21101120…451120文本数据特点参数选择问题特点:变量值稀疏且单一应用聚类分析存在的问题二、真实世界中医诊疗数据挖掘 的研究现状聚类的单分配性聚类结果示例

6、[10]在“辨证”时,一种症状可表现在不同的证候中,一个患者可以表现出不同的证候;在利用复方“论治”时,一种中药可以出现在不同的复方里。所以在分析这些中医问题时,都不适合单纯使用聚类方法。应用聚类分析存在的问题二、真实世界中医诊疗数据挖掘 的研究现状中医药术语的语义复杂性随着几千年语言文化的演变,中医术语普遍存在一词多义(Polysemy)和多词一义(Synonymy)的现象。如:“喘”与“气喘”,“纳呆”与“厌食”以及“食欲不振”,“不寐”与“失眠”等在症状中的不同描述,在中草药中如“瓜蒌”与“瓜壳”,“姜”与“生姜”等的描述,在证候中如“伤寒”一词,可以是外感病的统称,也可以指外感

7、风寒的感冒。在聚类挖掘中距离(或密度)的计算时,难以顾及特证词的语义问题。解决办法二、真实世界中医诊疗数据挖掘 的研究现状参数选择问题聚类的单分配性中医药术语的语义复杂性专家指导、算法反复尝试采用模糊聚类算法或其它算法建立、完善中医临床术语系统,构建中医本体(Ontology)[125]??关联规则舌苔薄(白)=>中虚气滞(50%);舌质红=>中虚气滞(66%);胃脘痞胀∧舌苔薄(白)∧吞酸或泛酸∧舌质红=>中虚气滞(100%)基于辨证“中虚气

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。