欢迎来到天天文库
浏览记录
ID:33626521
大小:2.68 MB
页数:46页
时间:2019-02-27
《关联规则eclat算法改进研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、重庆大学硕士学位论文中文摘要摘要数据挖掘是从海量数据中获取有效的、新颖的、潜在有用的知识,并最终形成可理解的模式的非平凡过程。现今的数据库系统已经能够实现查询、统计和报表,但处理方式相对单一,都只是对一定范围内的数据进行简单的数字化处理,而不能提取隐藏在这些数据背后的内在信息。随着各行各业广泛应用信息管理系统,带来了数据量的急速膨胀,人们迫切希望有一种功能,它能够提供更高层次的数据分析,从而更好地支持决策或科研工作。关联规则挖掘是数据挖掘中关联分析的运用,是数据挖掘一个非常重要的学科,具有很高的理论价值和广泛的应用前景
2、。关联规则反映一个事物与其他事物之间的相互依存性和关联性。如果两个或多个事物之间存在着一定的关联关系,那么其中一个事物就能够通过其他事物预测到。关联规则挖掘算法用于发现关联规则,诸多的研究人员和学者对其进行了大量的研究。现有的关联规则算法大多数是基于Apriori和FP-growth的迭代算法。通常数据库有水平数据表示和垂直数据表示两种形式,本文深入分析了频繁项集的挖掘问题,描述了现有的关联规则分类和挖掘算法,并着重对传统Apriori算法和AprioriTid算法进行分析,指出了他们各自的优缺点。对于挖掘算法的性能,
3、通常采用垂直数据表示的算法要高于水平数据表示,Eclat算法是首个采用垂直数据表示的经典关联挖掘算法。本文首先对Eclat算法进行了深入地研究和分析,并在此基础上提出了一种改进算法——hEclat。该算法把散列表与布尔矩阵相结合,提出散列布尔矩阵的思想,对传统Eclat算法中求两个Tidsets集合交集的操作进行改进,以提高求交集的速度,从而达到提升整个算法生成频集、挖掘关联规则的效率。对关联规则挖掘而言,已有的很多研究只注重解决算法的时间效率,而忽视了关联规则的多维特性,通过在关系数据库中提取出用户感兴趣的多维关联规
4、则,在商务决策方面将更具指导意义,也更能够满足实际情况的需要。本文在传统Eclat算法基础上提出MD-Eclat算法,并构造了一种新的数据预处理方法,实现从关系数据库的普通表或视图中进行多维关联挖掘。由于算法利用了垂直数据表示的结构特征,因此不必对数据库进行多次扫描,也不必频繁构造模式树,只需要扫描数据库一次,改进后的算法执行时间效率高于同类算法。关键词:关联规则,垂直数据表示,散列,布尔矩阵,多维关联规则I重庆大学硕士学位论文英文摘要ABSTRACTDataminingisanon-trivialprocesswhi
5、chistoobtaineffective,novelandpotentiallyusefulknowledgefromthemassofdataandultimatelyformunderstandablepatterns.Databasesystemsofnowadayshavebeenabletoachievequery,statisticsandreports,butthetreatmentwererelativelyhomogeneouswhichareonlysimpledigitalprocessingf
6、oracertainrangeofdata,andalsocannotextracttheinherentinformationhiddeninthebackofdata.WiththewidelyusageofInformationManagementSysteminvariousindustryfields,itbringabouttherapidexpansionoftheamountofdata.Therefore,peopleareeagertohaveafunctionwhichcanprovideahig
7、herlevelofdataanalysis,sothatthedecision-makingandscientificworkcanbebettersupported.Associationruleminingistheapplicationofassociatedanalysisindatamining,whichisaveryimportantsubjectwithhightheoreticalvalueandextensiveapplication.Associationrulesreflecttheinter
8、dependenceandthecorrelationbetweenonethingandtheothers.Iftherearesomecorrelationsamongtwoormorethings,thenwecanpredictoneofthethingsthroughotherthings.Associationrule
此文档下载收益归作者所有