欢迎来到天天文库
浏览记录
ID:27715031
大小:237.50 KB
页数:7页
时间:2018-12-05
《数据挖掘技术在中医证候研究中的应用述评》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、中国中医急症2010年7月第19卷第7期JETCM.Jul.2010,Vol.19, ·1184·No.7·述评·数据挖掘技术在中医证候研究中的应用述评贾运滨1魏江磊2△中图分类号:R241文献标志码:A文章编号:1004-745X(2010)07-1184-03【摘要】本文通过对近年中医证候研究中运用数据挖掘技术情况的分析,试图展示中医证候研究中各种数据挖掘技术的优势及不足。在分析关联规则、集对分析、粗糙集理论、聚类分析、人工神经网络等方法后,笔者认为对于中医证候这样多维复杂且模糊不确定的巨量
2、数据,各种单一的研究方法都有其局限性;数种方法的组合可能会更好地诠释中医证候的特点,挖掘出更加有意义的信息。【关键词】中医证候规范化研究数据挖掘ReviewoftheApplicationinDataMiningTechnologyonChineseTraditionMedicineSyndromeStudy12JIAYun-bin,WEIJiang-lei1ShanghaiUniversityofTraditionalChineseMedicine(Shanghai201203)2Shuguan
3、gHospitalAffiliatedwithShanghaiUniversityofTraditionalChineseMedicine(Shanghai200021)【】AbstractThroughanalyzingthedataminingtechnologyusedintheTCMsyndromestudyinrecentyears,theimprovementandthedisadvantageofitwereexhibited.Afteranalysistoassociationru
4、les,setpairanalysis,roughsettheoryandclusteringanalysis,thesinglemethodwaslimitedbecausetheTCMsyndromeiscomplex,mul-ti-dimensional,fuzzyanduncertain.ThecomplementarycombinationmethodscouldbebetterintherequirementsofthecharacteristicsoftheTCMsyndrome.M
5、oreeffectknowledgewouldbeminedoutbythistechnology.【】KeywordsTCMSyndrome;Standardizestudy;DataMining数据挖掘是当今具有广阔应用前景的信息技术研究领域,Y成立”。支持度和置信度是描述关联规则的两个重要概念。如果是人工智能、统计学、机器学习、神经网络、模式识别、信息检索D中有s%事件包含X,则s为该规则在D中的支持度。如果在包、高性能计算和数据可视化等多领域相互交叉的研究方向。近年含X的事件中有c%包含X
6、∪Y,则称c为该规则的置信度[1-2]。来,数据分析技术与特定领域知识的结合,特定任务提供了满意可以看出,支持度是规则前件在D中的发生概率,置信度是在的数据挖掘解决方案,为这些行业的信息化发展作出了突出的前件发生的前提下后件发生的条件概率。给定一个交易集D,挖贡献。数据挖掘技术是一种从大量的、不完全的、有噪声的、模糊掘关联规则问题就是产生支持度和可信度分别大于用户给定的的、随机的实际应用数据中,提取隐含在其中的,事先未知、但又最小支持度和最小置信度的关联规则。是潜在有用的信息和知识的过程。中医证候
7、的数据即具有这样在中医证候的研究中,运用关联规则可以从复杂巨量的证大量、模糊、随机的特点。因此,数据挖掘技术在近年中医证候的候数据库中找出某种证型规律。郑利荣等[3]则利用关联规则算规范化研究中应用日益广泛。为了能更好地运用该技术,现将近法成功开发了中医证候信息数据库系统,并提出了一个高效的年在中医证候研究中常用的数据挖掘方法的优劣作一述评,以中医数据挖掘模型。但多数情况下由于中医证候多维动态的复期能对中医证候研究有所启迪杂性,及其不确定性等特点,包括主次症在证候诊断中的贡献度。倒置,即次症往往决
8、定证候类型,得出的观测症状、证候指标之 1关联规则间的关联关系往往不足以反映临床实际。而且关联规则中规则 关联规则是数据挖掘中应用较多的方法之一。规则就是一AB有一定欺骗性,其只是给出A、B的条件概率的估计值,并 个条件与一个结果之和:Ifconditionthenresult。关联规则的定义不度量A与B之间蕴涵的实际强度,因此绝大多数的关联对于为:设I=i1,,…,im是子项集合,事件T是任意子项的集合,i2中医临床证候诊断意义不大。此外,最小支持度和置信度的设定 即TI
此文档下载收益归作者所有