资源描述:
《基于频繁项集树的时态关联规则挖掘算法-控制与决策》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第33卷第4期控制与决策Vol.33No.42018年4月ControlandDecisionApr.2018文章编号:1001-0920(2018)04-0591-09DOI:10.13195/j.kzyjc.2017.0212基于频繁项集树的时态关联规则挖掘算法王玲y,李树林,徐培培,孟建瑶,彭开香(1.北京科技大学自动化学院,北京100083;2.北京科技大学工业过程知识自动化教育部重点实验室,北京100083)摘要:针对目前时态关联规则研究中存在的挖掘效率不高、规则可解释性低、未考虑项集时间关联关系等问题,在原有相关研究的基础上,提出一
2、种新的基于频繁项集树的时态关联规则挖掘算法.通过对时间序列数据进行降维离散化处理,采用向量运算生成频繁项集,提高频繁项集挖掘效率.考虑到项集之间的时态关系以及树结构的优势,提出一种新的频繁项集树结构挖掘时态关联规则,其挖掘频繁项集与树结构构建同时进行,无需产生候选项集,提高了规则挖掘效率.实验表明,对比于其他算法,所提出算法在挖掘效率和规则解释性方面效果更好,具有较好的应用前景.关键词:向量运算;时态关系;频繁项集树;时态关联规则中图分类号:TP311文献标志码:ATemporalassociationrulesminingalgorithmb
3、asedonfrequentitemsetstreeWANGLingy,LIShu-lin,XUPei-pei,MENGJian-yao,PENGKai-xiang(1.SchoolofAutomation&ElectricalEngineering,UniversityofScienceandTechnologyBeijing,Beijing100083,China;2.KeyLaboratoryofKnowledgeAutomationforIndustrialProcessesofMinistryofEducation,Universit
4、yofScienceandTechnologyBeijing,Beijing100083,China)Abstract:Inordertoimprovetheefficiencyandenhancetheinterpretabilityinminingthetemporalassociationrules,anewminingalgorithmoftemporalassociationrulesbasedonfrequentiemsetstreeisproposed.Thetimeseriesdataisdiscretizedafterthedim
5、ensionreduction,onthisbasis,vectoroperationsareadoptedtogeneratefrequentitemsetstoimprovetheefficiency.Inviewoftheadvantageofthestructureofthetreeandthetemporalintervalrelationbetweentheitems,afrequentitemsetstreeisconstructedinparallelwithminingfrequentitemsetstoimprovetheeffic
6、iencyofruleminingwithoutgeneratingcandidateitemsets.Experimentalresultsshowthattheproposedalgorithmcanprovidebetterefficiencyandinterpretabilityinminingtemporalrulesincomparisonwithotheralgorithmsandhasgoodapplicationprospects.Keywords:vectoroperation;temporalrelationship;freq
7、uentitemsetstree;temporalassociationrules0引䀰间的关系等,更好地挖掘隐藏在数据中的与时间关联在现实世界中,大多数信息都包含时间属性,如的知识.股票的每日波动、超市的交易、含时间的实验数据等,目前,时态关联规则的算法已有一些研究成果,它们也被称为时态数据,即随时间变化且在不同时间文献[1]提出了一种基于时间区间延展与归并技术的状态上是相互关联的数据.事实上,时态数据挖掘已时态关联规则发现算法,文献[2]利用具有时间约束经有了许多研究成果,其中时态关联规则是加了时间的频繁项集挖掘关联规则.然而,这些算法在挖
8、掘频约束的关联规则,目的是找出时态事务集中同一维属繁项集时均利用了Apriori算法,会产生大量的候选性与时间之间的关联,以及基于时域的不同维属性之项