欢迎来到天天文库
浏览记录
ID:33165723
大小:1.36 MB
页数:59页
时间:2019-02-21
《基于可拓理论的关联规则应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、大连海事大学硕士学位论文基于可拓理论的关联规则应用研究姓名:郭志强申请学位级别:硕士专业:应用数学指导教师:刘巍20040301摘要数据挖掘是一个多学科领域,从多个学科汲取营养,这些学科包括数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识库系统、知识获取、信息检索、高性能计算和数据可视化。数据挖掘的一个重要的任务就是发现数据库中的关联规则,也就是发现数据项中项集之间有价值的关联或相关联系。当前,大部分关联规则的挖掘算法均以Apriori算法为核心,并其对象主要是布尔关联规则。本文研究的主
2、要工作是采用可拓理论的相关性提出了可拓关联规则,并与当前的关联规则挖掘方法相结合,为量化关联规则的研究提供新的方法,在本文中,我们把可拓关联规则主要应用在量化关联规则的挖掘上。主要研究成果是:1。本文结合物元理论给出了可拓关联规则的定义和表示方法,使得关联规则更接近人的观点,开拓了关联规则的定义。2.在原有的Apriori算法的基础上提出了在关系数据库中的可拓关联规则挖掘算法。通过对关系数据库建立相应的物元集,讨论物元集中一些特征与特征的关系,发现有价值的关联。并且通过粗糙集理论和概念树相结合的方法。对
3、关系数据库进行了相应的离散映射。关键词:数据挖掘关联规则相关性可拓关联规则AbstractDataminingisamultidisciplinaryfield,drawingworkfromareasincludingdatabasetechnology,artificialintelligence,machinelearning,neuralnetworks,stastics,patternrecognition,knowledge-basedsystems,knowledgeacquisition
4、,informationretrieval.high—performancecomputing,anddatavisualization。Discoveringassociationrulesisoneofthemostimportanttaskindatamining,Atpresent,thecoreofthemostassociationruleisthealgorithm.ThemaintargetisBooleanassociationrules.Themalniyresearchofthep
5、ap盯istwoparts:wepresentassociationruleofextensiontheorybyusingtherelativityoftheextentiontheory;andconbiningitandthepresentminingmethodofassociationruleputsforwardminingalgorithmofquantitativeassociationrule.Thecreationinthispaperisthatwepresentanalgorit
6、hmofassociationrules,discoverybasedonextensiontransformationandApriorialgorithm.Thepapersetsupthematter-elementset,accordingtodatabase,discussestherelationbetweencharacteristicandvalHe.discoveriesthevalueableassociationbasedonextensionspaceetc,datacompre
7、ssionremovingredundantdata.Combiningrou曲setandconcepttree,thepaperdoescorrespondingdiscretemappingforrelavitedata.Keyword:DataminingAssociationroleRelavivtyAssociationruleofextensiontheorylI第1章数据挖掘概况数据挖掘是一个新兴的研究领域,它在社会、经济等多方面都有着广泛的应用。什么激发了数据挖掘?数据挖掘是什么?它研
8、究什么东西?研究它有意义吗?本章主要针对这些问题,对数据挖掘领域作一简单介绍。1.1数据挖掘兴起及其现状1.1,1数据挖掘兴起近十几年来,人们利用信息技术生产和搜集数据的能力大幅度提高,无数个数据库被用于商业管理、政府办公、科学研究和工程开发等,这一势头仍将持续发展下去。于是,一个新的挑战被提了出来:在这被称之为信息爆炸的时代,信息过量几乎成为人人需要面对的问题。如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识,提高信息利用率呢?要
此文档下载收益归作者所有