欢迎来到天天文库
浏览记录
ID:33982551
大小:3.50 MB
页数:57页
时间:2019-03-02
《基于ilp的多关系关联规则数据挖掘(mrdm)算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、重庆大学硕士学位论文基于ILP的多关系关联规则数据挖掘(MRDM)算法研究姓名:孙江林申请学位级别:硕士专业:计算机软件与理论指导教师:邢永康2010-04重庆大学硕士学位论文中文摘要摘要基于属性-值的学习方法的命题化算法是关联规则挖掘算法的的传统方法,即,每一个事实都以的(属性,值)元组形式表示。这种表示形式中,属性种类是固定的,每个属性有一个给定的值与之对应,所以数据集可以被看做关系数据库中的一个表或关系。表中的每一行对应于一个样例,而每一列对应于一个属性。实际情况是,关系数据库为了有效地组织和访问数据,数据表结
2、构复杂,且以多关系的形式组织。关系数据库中的结构表达了位于不同关系中的元组间的联系,而这种联系体现了问题域中某些重要的背景知识和样例信息的结构内容。属性-值学习方法只适应单表无法直接利用这类联系及其蕴涵的信息内容,因而无法发现数据库中隐藏的复杂模式。虽然在理论上多个关系表可以转化到一个单表中,但事实上有许多实际问题无法避免。归纳逻辑程序设计(InductiveLogicProgramming,简记为ILP)是机器学习与逻辑程序设计的交叉领域,以ILP为基础的多关系数据挖掘,致力于发现关系数据库中涉及多个关系的复杂模式
3、。多关系数据挖掘可以直接在多个关系表上分析数据而无需向单一数据表的转换。由于其模式表示语言采用了一阶谓词逻辑语言,与命题逻辑语言相比表达力更强,能够表达更复杂的模式并方便的利用背景(领域)知识,应用也更为广泛,基于ILP的多关系数据挖掘成为目前研究的热点。本文比较系统和完整的介绍和分析了多关系关联规则挖掘的理论基础和相关研究,主要工作如下:①综合前人的工作,根据相关的文献,综述了多关系关联规则相关概念、性质、挖掘方法、面临的主要问题;②研究了数据挖掘的经典算法Apriori和FP-增长、并根据相关文献,结合自身研究,
4、分析了算法的提出、特点和算法步骤,并对的功能进行了分析。③研究了ILP技术的定义、形式化描述以及PROLOG语言的理论基础及运行机制。④分析了多关系关联规则代表性算法WARMR和FARMER,并分析其优缺点,并简单介绍了WARMR的拓展算法WARMeR。⑤通过实验平台,对经典算法Apriori进行了实现,并提出了改进措施,同时通过PROLOG实现了事实和规则的推理,分析了FARMER算法的实现基础,实现了WARMR算法,并挖掘出关联规则。关键词:多关系数据挖掘,ILP,多关系关联规则I重庆大学硕士学位论文英文摘要AB
5、STRACTLearningmethodintraditionaldataminingalgorithms,whichispropositionalgorithm,isattribute-valuealgorithm,eachsampleisexpressedintheformofattribute-valuegroup.Withthisrepresentation,theattributetypeisfixed,eachattributehasacorrespondingvaluegiven,sothedatase
6、tcanbeseenasarelationaldatabasetableorarelation.Eachtablerowcorrespondstoasample,andeachcolumncorrespondstoaattribute.Thefactis,therelationaldatabaseinordertoeffectivelyorganizeandaccessdata,thedatastructureinacomplexform,andformrelationshipswithmanyrelations.T
7、hestructureofrelationaldatabasesexpressedindifferentrelationslinkbetweentuples,andthislinkshowstheproblemdomainandsomeimportantbackgroundinformationonthestructureofthesamplecontent.Attribute-valueoflearningmethodtoadaptonlyasingletablecannotbedirectlylinkedandt
8、heimplieduseofsuchcontent,andcannotfindthehiddenforminthedatabase.Althoughintheorymorerelationaltablescanbeturnedintoasingletable,butinfacttherearemanypracticalproblemscanno
此文档下载收益归作者所有