欢迎来到天天文库
浏览记录
ID:33157714
大小:752.16 KB
页数:40页
时间:2019-02-21
《一种apriori的改进算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、浙江大学硕士学位论文一种Apriori的改进算法姓名:庄代波申请学位级别:硕士专业:计算数学指导教师:王兴华20030601致谢争s‰1本人在三年的硕士求学过程中,得到了导师王兴华老师的悉心指导和无私传授知识,终得以完成学业。尤其是本人在本文的整个写作过程得到了他的热心指导,给我提出了许多宝贵的、实用的建议,使得我得以顺利地完成。真心并诚挚地感谢他的关心和帮助。感谢本系全体的老师,他们是韩丹夫、吴庆标、郑士明、江金生、黄正达等,是他们无私地传授了许多知识和经验给了我,同时也感谢我单位的领导和同事王何宇给予我的鼓励和帮助。庄
2、代波2003.6本文摘要信息技术的不断推广应用,将企业带入了一个信息爆炸的时代。如何充分利用这些数据信息为企业决策者提供决策支持成为一个十分迫切的又棘手的问题,人们除了利用现有的关系数据库标准查询语句得到一般的直观的信息以外,必须挖掘其内含的、未知的却又实际存在的数据关系。相似序列地挖掘和关联规则的挖掘是其中之二种数据挖掘的类型。著名的Apriori算法是一种挖掘关联规则的算法。本文在相似序列的度量上提出一个用“生态位相似度量”的度量方法来解决序列的相似度量问题和在Apriori算法基础上提出改进的算法,通过对参与候选集的
3、元素计数的方法来减少产生候选集的组合和减少数据库的扫描次数来达到要求。这有利于提高挖掘的速度和减少数据库的I/O操作时间的开销。本文所提出的算法已经在信息管理系统得到应用,并证明是有效的。关键字:数据库,数据挖掘,相似序列,生态位相似度量,关联规则,Apriori算法,算法效率AbstractAninformationburstageiscomingwiththevariousapplicationofInformationtechnology.Howtomaximizetheinformationisaveryimpor
4、tantproblemforthedecision-makerofthecompanies.BesidesgettingtheregularinformationfromtheDatabasebySQL-query,peoplestillneedtominethedatarelationwhichisunclearbutreallyexistsAssociationrulesisoneofthedataminingmethods,thefamousalgorithmAprioriisamethod,whichcanbeus
5、edtosolutethoseproblemsThisarticleanalyzesandstudiestheimprovedalgorithmAprioribasedonthealgorithmofminingassociationrulesApriori.ThemainideaistodecreasethenumberofcandidateitemsandtodecreasethetimesofDatabasescanning.Thesolutionisavailable.Itupgradesthespeedofdat
6、amininganddecreasescomputer’SI/Ooperation.It’SprovedtobemoreefficientthanthetraditionalmethodKeywords:Database,Datamining,similarline,associationrules,Apriorialgorithm,algorithm’Sefficient4第一章:数据库信息技术的不断推广应用,将企业带入了一个信息爆炸的时代。每日、每时、每刻都有潮水般的信息出现在管理者的面前,等待管理者去处理、去使用。这
7、些管理信息的处理类型主要有事务型[4]和信息型[4]处理两大类。事务型处理,也就是通常所说的业务操作,对信息进行查询和修改,目的是满足特定的日常管理需要。在这类事件处理中,管理者关心的是信息能否得到快速的处理,信息的安全性能否得到保证,信息的完整性是否会遭到破坏。信息型处理则是指对信息做进一步的分析,为管理人员的决策提供支持。例如,为决策支持系统DDS[5]、经理信息系统、战略信息系统等提供信息分析的支持。1.关于数据库的概念数据库是一个结构化的数据集合。主要是通过综合各个用户的文件,除去不必要的冗余,使之相互联系形成的数
8、据结构。联系是数据库的重要特点。它用于描述一个或多个相关组织的活动。【2】例如:一个零售药店的数据库可能包含如下信息:实体:药品信息,供货方信息,购买者信息实体间联系:药品进销,药品库存,资金收付2.数据库管理系统(DBMS)DBMS是辅助用户管理和利用大数据库集的软件,它具有如下几个优点:1).数据独
此文档下载收益归作者所有