试析基于web日志的网络用户聚类研究与实现

试析基于web日志的网络用户聚类研究与实现

ID:35133762

大小:1.71 MB

页数:61页

时间:2019-03-19

试析基于web日志的网络用户聚类研究与实现_第1页
试析基于web日志的网络用户聚类研究与实现_第2页
试析基于web日志的网络用户聚类研究与实现_第3页
试析基于web日志的网络用户聚类研究与实现_第4页
试析基于web日志的网络用户聚类研究与实现_第5页
资源描述:

《试析基于web日志的网络用户聚类研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、南京理工大学硕士学位论文基于Web日志的网络用户聚类研究与实现姓名:付志涛申请学位级别:硕士专业:计算机应用技术指导教师:宋斌20070601硕士论文基于Web日志的网络用户聚类研究与实现摘要聚类是数据挖掘中一种重要的挖掘方法,它从数据库中计算对象间的相似性,并依此对对象进行分类,使得不同类中的对象尽可能相异,而同一类中的对象尽可能相似,即“物以类聚”,发现数据中隐含的有用信息或知识,数据聚类在很多领域中有着广泛的应用。本文研究的主要内容是基于Web日志完成其潜在的网络用户聚类,获得的聚类结果可以作为网站结构的优化、站点的重构以

2、及个性化的服务和推荐的依据。本文分别从用户浏览路径的结构和内容两方面对Web日志中潜在的网络用户聚类进行深入的研究,分析了目前网络用户聚类的研究现状,着重研究用户浏览路径聚类算法(UBPC),指出该算法在网络用户聚类过程中存在的不足,并提出相应的改进。基于Web日志完成了用户识别、会话识别、事务识别等数据预处理过程,以用户的会话作为用户聚类的特征,引入一种计算有序的非数值数据对象相似度的方法,实现了基于浏览路径结构的用户聚类。引入了目标页和导航页的概念,提出一种先对目标页聚类再利用目标页聚类的结果进行用户聚类的方式,完成了基于浏

3、览路径内容的用户聚类。在上述两种用户聚类过程中均采用改进的用户浏览路径聚类算法(UBPC),最后对聚类结果进行了分析,提出一些网站结构优化以及个性化服务的建议。关键词:数据挖掘,Web日志,聚类算法,用户浏览路径,网络用户聚类硕士论文基于Web日志的网络用户聚类研究与实现AbstractClusteringisanimportantminingmethodofdatamining.Itfindsthecomparabilityamongtheobjectfromthedatabase,andclassifiestheobject

4、tomakedifferentobjectindifferentkindasmuchaspossible,andtheobjectinthesameclassareassimilaraspossible,i.e.”birdsofafeatherflocktogether”,thusoptimizetheimplicitusefulinformationorknowledgeintheinquiryoftheextensivedatabaseanddiscoverydata,thereisextensiveapplicationi

5、nalotoffieldsinthedataclustering.ThispapermainlyresearchesuserclusteringfromW曲Log.TheresultsofuserclusteringCallbcusedinoptimizingthenetworkstructureandreconstructingthewebsiteandbringingtheindividuationandrecommending.Thispapera11alysesandresearchesuserclusteringwhi

6、chhidesinWebLogfromtwoaspects:thestructureandcontentofuserbrowsingpaths.analysesthestatusofu螂clusteringatprcsent.AnalysingUBPCalgorithmisemphasis,pointingouttheproblemsofapplyingthisalgorithmtousefclusteringandproposingimprovementaccordingly.Thispaperhavefurlsheduser

7、identification、conversationidentification、sessionidentificationwhichareLogdatapretreatments.Intheprocessofuserclusteringbasedthestructureofuserbrowsingpaths,itintroducesamethodofaccountingthesimularvaluesbetweenorderednon-numcricaldata.Inthe,processofuserclusteringba

8、sedthecontentofuserbrowsingpaths,itintroducestheconceptionofobjcctpageandnavigationpage,proposesanewuserclusteringmethodwiththeresu

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。