探索基于web使用挖掘的用户模式识别研究

探索基于web使用挖掘的用户模式识别研究

ID:35125539

大小:2.62 MB

页数:66页

时间:2019-03-19

探索基于web使用挖掘的用户模式识别研究_第1页
探索基于web使用挖掘的用户模式识别研究_第2页
探索基于web使用挖掘的用户模式识别研究_第3页
探索基于web使用挖掘的用户模式识别研究_第4页
探索基于web使用挖掘的用户模式识别研究_第5页
资源描述:

《探索基于web使用挖掘的用户模式识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、湖南师范大学硕士学位论文基于Web使用挖掘的用户模式识别研究姓名:覃拥军申请学位级别:硕士专业:计算机应用技术指导教师:刘先锋20080501摘要数据挖掘是近年来随着数据库技术和人工智能技术的发展而出现的一种全新信息技术,也是计算机科学与技术,尤其是计算机网络的发展和普遍应用所提出的迫切需要解决的重要课题。数据挖掘是从大量数据库中发现人们感兴趣的、隐藏的、先前未知的知识。数据挖掘技术主要研究结构化的数据挖掘,而Web数据挖掘是应用于WWW的技术研究,是从半结构或无结构的Web页面中抽取令人感兴趣的、潜在的模式。Web服务器日志记录具有良好的结构,非常有利于进行数

2、据挖掘。Web使用挖掘是Web挖掘中三个研究领域中非常重要的一个研究方向,通过分析和探索Web日志记录中的规律,可以识别电子商务中的潜在客户,增强对用户的网络服务质量,并改进W曲服务器系统的性能。本文在基于聚类的基础上讨论了Web使用挖掘中的各种问题。首先系统地阐述了从数据挖掘、Web数据挖掘到Web日志挖掘整个过程。通过对基于Web日志的数据挖掘的讨论,说明如何进行Wrcb日志挖掘以及在Web日志挖掘中应采取的数据挖掘技术。然后从理论的角度对聚类进行较为全面的探讨,分析了聚类的概念,常见的聚类方法和常见的聚类的算法。在Web使用挖掘的模式识别阶段,本文对BIR

3、CH算法改进,将改进的算法应用于Web用户模式识别中,验证了算法的有效性。关键词,:数据挖掘,Web挖掘,Web使用挖掘,用户模式识别ABSTRACTDataminingisanewinformationtechnologywhichappearedwiththedevelopmentofthedatabasetechnologyandartificialintelligencetechnologyinrecentyears.Alsoitisanimportantsubjectwhichwasproposedbythedevelopmentandapplicat

4、ionofcomputerscienceandtechnology,especiallybythedevelopmentofcomputernetwork,anditshouldbesolvedurgently.’Dataminingisusedtodiscovertheinteresting,hiddenandunknownknowledgefrommassdata.Anditmainlydealswiththestructuraldata,whilewebdataminingisbasedonwwW,whichgetstheinterestingandpot

5、entialpatternfromthesemi—structuralornon—structuralwebpages.Thelogfilesofwebserverwithanicestructurewi1beconvenientfordatamining.Webusageminingisoneofthemostimportantresearchfieldsinwebmining.Itcouldfindoutthepotentialcustomersofe-commerceandenhancethequalityofwebservicebyanalyzingan

6、dexploringtherulesofweblogs.Moreover,itcouldimprovetheperformanceofthewebserver.Inthisthesis,wediscussdifferentquestionsofWebUsageMiningbasedonclustering.Firstly,itintroducesthedevelopmentfromdataminingandwebdataminingtoweblogmining.Bydiscussingdataminingbasedonweblog,itshowshowtopro

7、cesstheweblogminingandwhichdataminingtechnologyshouldbetakeninweblogmining.Then,wediscusstheclusteringtechnologyindepth,andanalyzetheconceptofclustering,thefamiliarclusteringmethodsandalgorithms.11DuringpatterndiscoveryphaseofWebUsageMining,thethesispresentsanamelioratedsolutionontra

8、ditionalBIRC

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。