新关联规则挖掘算法在web挖掘上的研究和应用

新关联规则挖掘算法在web挖掘上的研究和应用

ID:34355998

大小:484.50 KB

页数:60页

时间:2019-03-05

新关联规则挖掘算法在web挖掘上的研究和应用_第1页
新关联规则挖掘算法在web挖掘上的研究和应用_第2页
新关联规则挖掘算法在web挖掘上的研究和应用_第3页
新关联规则挖掘算法在web挖掘上的研究和应用_第4页
新关联规则挖掘算法在web挖掘上的研究和应用_第5页
资源描述:

《新关联规则挖掘算法在web挖掘上的研究和应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类TP301.6密级_____________硕士学位论文新关联规则挖掘算法在WEB挖掘上的研究和应用王明芳导师姓名职称:蒋芸副教授专业名称:研究方向:计算机软件与理论数据挖掘论文答辩日期:2012.05学位授予日期:2012.06答辩委员会主席:评阅人:二零一二年五月硕士学位论文M.DThesis新关联规则挖掘算法在WEB挖掘上的研究和应用ResearchandApplicationofANewAssociationRulesMiningAlgrithmonWebMining王明芳WangMing-fang独创性

2、声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包括其他人已经发表或撰写过的研究成果,也不包含为获得西北师范大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:日期:关于论文使用授权的说明本人完全了解西北师范大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(

3、保密的论文在解密后应遵守此规定)签名:导师签名:I日期:摘要数据挖掘是近年来随着数据库技术和人工智能技术的发展而出现的一种信息技术,它融合了数据库、人工智能以及统计学等多种学科,试图从数据库中提取出先前未知、有效和实用的知识。Web数据挖掘是传统数据挖掘技术在Web环境下的应用,是从Web上的数据(如Web日志、页面内容等)中发现用户的浏览模式或寻找相关的Web页面,Web使用模式挖掘主要是对Web日志数据进行分析处理。关联规则是Web挖掘中一个重要的研究领域。为了挖掘出隐藏在数据间的相互关系,将关联规则的概念引入到Web挖掘系

4、统中,把用户的访问路径以关联规则的形式表现出来。通过挖掘用户的频繁访问路径来重构站点的页面之间的链接关系,以改进Web站点设计使其更适应用户的访问习惯,同时也可以为用户提供个性化的信息服务。所以本文提出的基于粗糙集和单事务项组合的关联规则挖掘算法在Web上的应用具有理论意义和现实意义。本文主要工作和创新点如下:(1)提出一种新的基于粗糙集和单事务项组合的关联规则挖掘算法。Apriori算法必须反复地扫描数据库才能求出频繁项集,效率较低,且不支持更新挖掘。为了解决这些问题,提出了一种基于粗糙集、单事务项组合和集合运算的关联规则挖掘算法。

5、本算法只需要扫描一次数据库,同时有效地支持了关联规则的更新挖掘。应用实例和实验结果表明,该算法明显优于Apriori算法,是一种有效且快速的关联规则挖掘算法。(2)新关联规则挖掘方法在Web挖掘中的应用将提出的基于粗糙集和单事务项组合的关联规则挖掘方法应用在Web挖掘中,对log日志进行挖掘,分析用户的浏览行为挖掘出频繁访问路径,找出在服务器会话中最经常一起出现的页面。挖掘所得到的规则可以帮助网站设计者重新组织和设计Web站点的结构,也可以作为启发式信息用于缓存中的页面预取,减少用户的下载延迟,缩短用户在网络上的访问延迟,还可以更好的

6、给用户提供推荐服务。关键词:粗糙集;单事务项组合;关联规则;Web挖掘IIAbstractDataMiningisanewinformationtechnologythathasbeendevelopedwiththetechnologyofDatabaseandArtificialIntelligence,whichintegratesofDatabase,AIandStatisticsandetc.Ittriestoextracttheunknown,effectiveandusefulknowledgefromdatabase.

7、WebMiningisthetraditionalDataMiningtechnologyapplicationusedinweb,whichcanextractuser’sbrowseandfindtherelativewebpagesfromdata(suchasweblog,webpagecontent)onweb.WebUsageMiningmainlyprocessesandanalysestheweblogdatawhichisgenerallyredundancy.Associationrulesisanimportan

8、tareaofWebMining.Inordertofindoutthehiddencorrelationamongthedata,theconceptofassociationruleswasintroducedint

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。