探索关联规则数据挖掘频繁项目集发现算法的研究

探索关联规则数据挖掘频繁项目集发现算法的研究

ID:34826761

大小:1.85 MB

页数:72页

时间:2019-03-11

探索关联规则数据挖掘频繁项目集发现算法的研究_第1页
探索关联规则数据挖掘频繁项目集发现算法的研究_第2页
探索关联规则数据挖掘频繁项目集发现算法的研究_第3页
探索关联规则数据挖掘频繁项目集发现算法的研究_第4页
探索关联规则数据挖掘频繁项目集发现算法的研究_第5页
资源描述:

《探索关联规则数据挖掘频繁项目集发现算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:~—UDC:——————二一密级:垒i!:编号:——工学硕士学位论文(在职人员)关联规则数据挖掘频繁项目集发现算法的研究作者:指导教师:学位级别:学科、专业:所在单位:论文提交日期:论文答辩臼期:学位授予单位:顾泽元杨静教授工学硕士计算机应用技术计算机工程学院2005年4月2005年6月哈尔滨工程大学哈尔滨工程大学硕士学位论文摘要数据挖掘是当今人工智能和数据库研究方面最富活力的领域。数据挖掘是指从大量的数据中发现潜在的、有用的知识的过程。关联规则数据挖掘则是数据挖掘的一个主要研究内容。而频繁项目集的发现是关联规则数据挖掘的核心问

2、题。本文充分论述了典型的频繁项目集发现算法Apriori算法、AprioriTid算法,及已有的对于频繁项目集发现算法相关的改进措施的优缺点。在此基础上,本文给出了对于频繁项目集发现算法的一些新的、有效的改进措施。首先提出了动态自适应的方法,明显减少了事务数据库的扫描次数;其次提出了逐渐减小事务数据库中事务记录长度的方法,大大地提高了频繁项目集发现算法的时间效率;最后在项目集的搜索方面,根据项目集的有序性,采用了二分法查找的方法,大大节省了系统在项目集搜索方面的时间。根据以上所提出的改进措施,又综合已有的改进算法的优点,本文给出了一个频

3、繁项目集发现的新的算法——AprioriAuto算法。该综合算法在减小数据库扫描次数、减少候选项目集的数量及提高算法用于搜索的时间效率等方面都得到了明显的有效的改进。关键词:数据挖掘;关联规则;Apfiofi算法;Apriori_Auto算法哈尔滨工程大学硕士学位论文AbstractDataMiningisoneofthemostactiveresearchfields,especialinthefieldsofartificialintelleginceanddatabasereasearch.DataMiningisakindofp

4、rocessthatrevealspotentialusefulknowledgefrommassivedata.Theassociationruleminingisamainresearchaspectofdatamining.Andthediscoveryofthefrequentitemsetsisakeyproblemoftheassociationrulemining.Inthethesiswefullydescribethemosttypicaldiscoveryalgorithmsofthefrequentitemsets

5、,ApriorialgorithmandApriori_Tidalgorithm,anddiscusstheadvantagesandthedisadvantagesofsomeexistentimprovedmethods.Basedontheseworkswepresentseveralneweffectiveimprovedmethodsforthediscoveryalgorithmofthefrequentitemsets.First,thedynamicself-adaptivemethodispresentedinorde

6、rtoobviouslyreducethetimesofscanning订ansacfionsdatabaseSecond,wepresentthemethodofgraduallyreducingthelengthoftransactionrecordstoconsumedlyimprovetheefficiencyofthefrequentitemsetsdiscoveryalgrothm.Atlast,ontheaspectofsearchingtheitemsets,accordingtotheorderalnatureofth

7、eitemsets,thebinarysearchingmethodisadoptedtoimporvethesearchingefficiency.Baseonthesenewimprovedmethodsontheabove,andfullyconsideringtheadvantagesoftheexistingimprovedmethods,theauthorpresentsanewdiscoveryalgorithmofthefrequentitemset—priori_AutoAlgorithm.Thealgorithmha

8、sobviousandeffectiveimprovementsontheaspectsofreducingthedatabasescanningtimes,reducingthecandidateitem

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。