欢迎来到天天文库
浏览记录
ID:34826761
大小:1.85 MB
页数:72页
时间:2019-03-11
《探索关联规则数据挖掘频繁项目集发现算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:~—UDC:——————二一密级:垒i!:编号:——工学硕士学位论文(在职人员)关联规则数据挖掘频繁项目集发现算法的研究作者:指导教师:学位级别:学科、专业:所在单位:论文提交日期:论文答辩臼期:学位授予单位:顾泽元杨静教授工学硕士计算机应用技术计算机工程学院2005年4月2005年6月哈尔滨工程大学哈尔滨工程大学硕士学位论文摘要数据挖掘是当今人工智能和数据库研究方面最富活力的领域。数据挖掘是指从大量的数据中发现潜在的、有用的知识的过程。关联规则数据挖掘则是数据挖掘的一个主要研究内容。而频繁项目集的发现是关联规则数据挖掘的核心问
2、题。本文充分论述了典型的频繁项目集发现算法Apriori算法、AprioriTid算法,及已有的对于频繁项目集发现算法相关的改进措施的优缺点。在此基础上,本文给出了对于频繁项目集发现算法的一些新的、有效的改进措施。首先提出了动态自适应的方法,明显减少了事务数据库的扫描次数;其次提出了逐渐减小事务数据库中事务记录长度的方法,大大地提高了频繁项目集发现算法的时间效率;最后在项目集的搜索方面,根据项目集的有序性,采用了二分法查找的方法,大大节省了系统在项目集搜索方面的时间。根据以上所提出的改进措施,又综合已有的改进算法的优点,本文给出了一个频
3、繁项目集发现的新的算法——AprioriAuto算法。该综合算法在减小数据库扫描次数、减少候选项目集的数量及提高算法用于搜索的时间效率等方面都得到了明显的有效的改进。关键词:数据挖掘;关联规则;Apfiofi算法;Apriori_Auto算法哈尔滨工程大学硕士学位论文AbstractDataMiningisoneofthemostactiveresearchfields,especialinthefieldsofartificialintelleginceanddatabasereasearch.DataMiningisakindofp
4、rocessthatrevealspotentialusefulknowledgefrommassivedata.Theassociationruleminingisamainresearchaspectofdatamining.Andthediscoveryofthefrequentitemsetsisakeyproblemoftheassociationrulemining.Inthethesiswefullydescribethemosttypicaldiscoveryalgorithmsofthefrequentitemsets
5、,ApriorialgorithmandApriori_Tidalgorithm,anddiscusstheadvantagesandthedisadvantagesofsomeexistentimprovedmethods.Basedontheseworkswepresentseveralneweffectiveimprovedmethodsforthediscoveryalgorithmofthefrequentitemsets.First,thedynamicself-adaptivemethodispresentedinorde
6、rtoobviouslyreducethetimesofscanning订ansacfionsdatabaseSecond,wepresentthemethodofgraduallyreducingthelengthoftransactionrecordstoconsumedlyimprovetheefficiencyofthefrequentitemsetsdiscoveryalgrothm.Atlast,ontheaspectofsearchingtheitemsets,accordingtotheorderalnatureofth
7、eitemsets,thebinarysearchingmethodisadoptedtoimporvethesearchingefficiency.Baseonthesenewimprovedmethodsontheabove,andfullyconsideringtheadvantagesoftheexistingimprovedmethods,theauthorpresentsanewdiscoveryalgorithmofthefrequentitemset—priori_AutoAlgorithm.Thealgorithmha
8、sobviousandeffectiveimprovementsontheaspectsofreducingthedatabasescanningtimes,reducingthecandidateitem
此文档下载收益归作者所有