改进的apriori算法及其在领域数据挖掘中的应用

改进的apriori算法及其在领域数据挖掘中的应用

ID:37545263

大小:1.20 MB

页数:52页

时间:2019-05-25

改进的apriori算法及其在领域数据挖掘中的应用_第1页
改进的apriori算法及其在领域数据挖掘中的应用_第2页
改进的apriori算法及其在领域数据挖掘中的应用_第3页
改进的apriori算法及其在领域数据挖掘中的应用_第4页
改进的apriori算法及其在领域数据挖掘中的应用_第5页
资源描述:

《改进的apriori算法及其在领域数据挖掘中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、河北工业大学硕士学位论文改进的Apriori算法及其在领域数据挖掘中的应用姓名:王芳申请学位级别:硕士专业:计算机应用技术指导教师:顾军华20091101河北工业大学硕士学位论文改进的Apriori算法及其在领域数据挖掘中的应用摘要随着计算机的普及应用和计算机网络的飞速发展,在过去若干年里,无论是商业企业、科研机构或者政府部门,各个领域都积累了海量的并以不同形式存储的数据。面对如此多的数据,人们不再满足于日常的事务处理,而是更加关注能否从形式不同的,分散的,纷繁复杂的数据环境中得到有用的决策信息,

2、从而可以做出正确的分析和决策。数据仓库和数据挖掘技术的产生为这个领域数据难题提供了一个很好的解决方案。数据仓库是一个面向主题的、集成的、不可更新的且随时间不断变化的数据集合,用来支持管理人员决策的系统,它可以把领域内以不同形式存储的海量数据集成在一起供分析人员进行分析。数据挖掘是一个从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,数据挖掘技术为领域数据分析人员提供数据分析的方法。本文首先对数据仓库和数据挖掘技术进行了研究,提

3、出领域数据仓库构建的三层模型结构和领域数据挖掘系统开发方法。进而重点研究了关联规则挖掘算法,通过深入研究Apriori算法及其一些现有改进算法,针对Apriori算法的不足提出四点改进,设计完成了基于项集重排序的Apriori_Sort算法。为了验证改进后算法的有效性,本文做了大量的实验,实验证明,改进后的算法由于大大减少了候选项集的数量从而提高了算法的效率。将Apriori_Sort算法应用到能源领域的数据挖掘系统中,对多维能源数据进行了关联规则挖掘,通过对关联规则分析得到一些能源领域内一些节能

4、方案。最后,对领域数据挖掘的进一步发展和能源数据挖掘的进一步完善做出了展望。关键词:领域数据挖掘,领域数据仓库,Apriori_Sort算法i改进的Apriori算法及其在领域数据挖掘中的应用IMPROVEDAPRIORIALGORITHMANDITSAPPLICATIONINDOMAINORIENTEDDATAMININGABSTRACTWiththepopularityofcomputerapplicationsandtherapiddevelopmentofcomputernetworksi

5、nthepastseveralyears,allcommercialenterprises,researchinstitutionsandgovernmentdepartmentshaveaccumulatedmassdatathatisstoredindifferentforms.Facingsomuchdata,peoplenolongersatisfiedwiththedailytransactionprocessing,butconcernedmoreaboutwhethertheycan

6、getusefulinformationinmakingdecisionsfromthedecentralized,diverseandcomplexdataenvironments.Datawarehouseanddataminingtechnologyprovidesagoodsolutionfortheprobleminthisarea.Datawarehouseisasubject-oriented,integrated,andnon-renewabledatacollectionwhic

7、hischangedovertime.Itisusedtosupportdecision-makingsystemformanagement,whichcanintegratedthemassdatastoredindifferentformswithinthefieldsforanalysis.Dataminingisfromalotof,notcomplete,thereisnoise,andvague,randomdata,extractingimplicitinthework,thatpe

8、opledonotknowinadvance,butispotentiallyusefulinformationandknowledgeintheprocessof,thefieldofdataminingtechnology,dataanalysis,providingdataanalysismethods.Thispaperstudiedaboutthedatawarehouseanddataminingtechniquesandputforwardthree-tiermode

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。