欢迎来到天天文库
浏览记录
ID:33299742
大小:2.50 MB
页数:53页
时间:2019-02-23
《基于web日志的若干挖掘算法及其应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、东南大学硕士学位论文基于Web日志的若干挖掘算法及其应用研究姓名:顾海花申请学位级别:硕士专业:计算机应用技术指导教师:孙志挥20080818摘要Web日志挖掘是Web挖掘领域中的一个重要应用研究方向。为用户提供一个不仅内容丰富而且方便实用的网站,以更有效地进行网上浏览,这是每个网站所追求的目标。此外,Web站点能否实现个性化,为用户提供个性化的服务,亦已成为衡量站点能否成功的重要因素。通过挖掘Web日志,可以发现用户的访问模式,对优化站点结构和为用户提供个性化服务具有重要的意义。本文介绍了Web数据挖掘的产生背景,简要地阐述了数据挖掘技术与Web数据挖掘的一般技术、方法和
2、策略,对Web日志数据挖掘过程及其中各环节的关键技术进行了比较深入的探讨。在分析Web日志记录结构及含义的基础上,结合相关课题的研究任务,并以南京信息职业技术学院WWw站点的需求为背景,对Web日志的若干算法及研究进行了研究,并结合挖掘结果给出了优化设计建议,主要工作如下:1)介绍了Web日志挖掘的相关基本概念,着重研究了Web日志挖掘中的数据预处理过程,将Frame页面过滤技术运用到预处理过程中;2)对Web日志若干挖掘算法进行了研究,介绍了将数据挖掘领域的关联规则挖掘、序列型式挖掘、聚类等挖掘方法应用于Web日志的具体方法和过程,研究了利用路径遍历模式挖掘方法来发现用户
3、浏览模式的过程;3)介绍了Web日志挖掘结果的应用,利用挖掘出的规则和模式,对Web站点的结构和站点内页面进行调整的改善,并根据用户的浏览情况.自动生成导航提示。关键词:数据挖掘Web日志页面过滤路径遍历模式访问模式ABSTRACTDataminingbasedonWebLogisamainaspectofWebmining.HowtomakethetlesrsfindtheinformationtheyareinterestedinmorequicklyandexpedientlyistheaimofeveryWebsite.Ifthesite’Scapabilityis
4、improved,itwillattractmoreuserstovisitit.AndwhetherthesiteCanprovidetheindividuationserviceisanimportantfactortoestimateit.Throughdatamining011Weblog,wecanfindtheuserstraversalmode.Itwillhelp惦toimprovethesite’Sstructureandprovidethebetterseivicetotheusers.Thispaperintroduce‘thebackgroundof
5、Webdatamining,systematicallyexpands,thetechnique,theoryandstrategy,makingadeeperdiscussiononthekeytechniqueoftheprocessinWeblogmining.BasedondataminingontheWebLogofthewebsiteofNanjingCollegeofInformationTechnology,someoptimizationdesigningsuggestionsaleproposed.Theworksalefollowing:1)There
6、levanceclassicalconceptofWebLogminingaleintroduced.IntheWeblogpreprocessingaspect,haveproposedonekindimprovesresultmethodofpreprocessed--framepagefilterstechnology.2)SomealgorithmsofWebLogminingaleintroduced.Transactionmodelesarcconstructedfortheapplicationofvariousdataminingtaskssuchasthe
7、discoveryofassociatonrules,sequentialpatternsandsoon,andtheconcretemethodsandcoursesduringtheirapplicationaregiven.Amethodcalledpathtraversalpatternsisalsoreferencedtodiscoveruseraccesspatterms.3)Finally,therulesandpattermsacquiredastheresultofWeblogmingingare
此文档下载收益归作者所有