欢迎来到天天文库
浏览记录
ID:32389173
大小:1.03 MB
页数:4页
时间:2019-02-04
《数据挖掘中关联规则算法的研究及应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第36卷增刊东南大学学报(自然科学版)Vol36Sup2006年7月JOURNALOFSOUTHEASTUNIVERSITY(NaturalScienceEdition)July2006数据挖掘中关联规则算法的研究及应用高杰李绍军钱锋(华东理工大学自动化研究所,上海200237)摘要:针对Apriori和AprioriTid算法中存在的项集生成瓶颈问题,提出了一种基于事务集压缩、候选项集压缩和支持度布尔矩阵的改进Apriori
2、Tid算法.该算法中通过删去不必比较的事务来有效缩减数据集;优化频繁项集的自连接方式来减少生成的候选项集个数;使用支持度布尔矩阵来加快候选项集的验证速度.实验结果表明改进算法比原算法执行效率明显提高,同时也验证了该算法在油液监测故障诊断中的有效性.关键词:数据挖掘;关联规则;Apriori算法;AprioriTid算法;频繁项集;故障诊断中图分类号:TP31113文献标识码:A文章编号:1001-0505(2006)增刊012804ApplicationofassociationrulesalgorithmindataminingGaoJieL
3、iShaojunQianFeng(InstituteofAutomation,EastChinaUniversityofScienceandTechnology,Shanghai200237,China)Abstract:AnimprovedAprioriTid(IAT)algorithmisproposed,whichisbasedontransactionsreduction,candidateitemsetsreductionandsupportmatrixtosolvethebottleneckofitemsetsgeneration.Thi
4、smethodminimizesthedatabasebydeletingtransactionswhichneednotbescanned,reducesthenumberofcandidateitemsetsbyoptimizingthejointprocedureoffrequentitemsetsandacceleratestheverificationspeedofcandidateitemsetsbyusingthesupportmatrixmethod.Experimentalresultsprovethehighefficiency
5、oftheproposedalgorithm.ThesimulationresultsofoilmonitoringforfaultdiagnosisalsoshowthevalidityoftheIATalgorithm.Keywords:datamining;associationrules;Apriorialgorithm;AprioriTidalgorithm;frequentitemsets;faultdiagnosis近年来,随着数据库技术、人工智能和数理统计等技术的发展,数据库中的知识发现(KDD)和数据挖掘(datamining)
6、技术应运而生.知识发现表示从初级数据提取高级知识的整个过程.数据挖掘是知识发现大处理过程中的一部分,知识发现处理过程是成功地实现数据挖掘的基础.数据挖掘按照既定的任务目标通过特定的算法在可接受的计算效率限制内生成特定模式的一个步骤,可以从大量的、随机的数据中揭示出潜在的、有用的并能被人理解的趋势和模式的高级处理过程.1关联规则和Apriori算法关联规则挖掘是数据挖掘的重要研究方向,侧重于发现数据库或数据仓库记录之间有趣的关联性或者相互关系,根据这种关联性就可从某一记录的属性信息来推断其他记录的属性信息.关联性是一种统计意义上的关系,并以支持度和置信
7、度作为衡量关联的程度.通常须设定最小支持度和最小的置信度作为阀值,满足最小支持度和最小置信度阀值的规则称为强关联规则或有趣规则.关联规则在商业领域的成功应用,使它成为数据挖掘中最成熟、最重要、最活跃的研究内容.[1]最著名的、最有影响的关联规则挖掘算法是Agrawal等人提出的Apriori算法.Apriori算法将发现关联规则的过程分为2步:第1步识别所有的频繁项集,即支持度不小于用户指定的最小支持度的项集;第2步从频繁项集中构造其置信度不小于用户给定的最小置信度的规则.由于第2步较为容易和直观,因此挖收稿日期:20060420.基金项目:国家
8、重点基础研究发展计划(973计划)资助项目(2002CB3122000)、国家高技术研究发展计划(863计划
此文档下载收益归作者所有