web使用挖掘中会话识别方法研究

web使用挖掘中会话识别方法研究

ID:33382166

大小:4.05 MB

页数:56页

时间:2019-02-25

web使用挖掘中会话识别方法研究_第1页
web使用挖掘中会话识别方法研究_第2页
web使用挖掘中会话识别方法研究_第3页
web使用挖掘中会话识别方法研究_第4页
web使用挖掘中会话识别方法研究_第5页
资源描述:

《web使用挖掘中会话识别方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、合肥工业大学硕士学位论文WEB使用挖掘中会话识别方法研究姓名:余笪申请学位级别:硕士专业:管理科学与工程指导教师:凌海峰201204WEB使用挖掘中会话识别方法研究摘要随着互联网,特别是近年来电子商务的迅猛发展,使得web上的信息呈现“爆炸式”增长,网络已经开始逐步改变人们的生活习惯和工作方式,这也为商家提供了新的市场和营销策略。Web使用挖掘主要是通过对web服务器中日志的分析,通过对网络用户浏览行为的分析发现隐藏的用户有用信息或模式。从而指导电子商务活动的有效性和针对性,如网站设计、个性化服务和商业决策等。会话识别不仅是web使用挖掘的难点,同时也是用户访问行为分析的

2、基础和关键工作,其质量对于web使用挖掘结果的准确度具有决定性的影响。针对目前常用的会话识别方法的局限性,本文分别从聚类和用户访问行为特点的角度对会话识别进行深入研究。一方面,针对以前基于启发式算法划分会话的不足,从聚类的角度来通过构建一定的优化模型来划分会话。利用改进的K-means聚类算法进行会话聚类。根据统计学的知识确定了初始聚类中心点和K值,再根据一个会话中记录时间有序性的特点改进算法,提高了算法的准确度。另一方面,根据用户访问行为的特点,采用合并和拆分的会话识别算法。利用层次聚类算法的基本思想实现会话的合并,再经过会话的二次识别将合并的会话进行必要的拆分,从而增

3、加了会话识别的准确度。本文对会话识别算法的研究具有一定程度的现实意义。首先,它将聚类算法应用到会话识别领域具有一定的参考价值,在一定程度上丰富了聚类算法的应用领域;其次,它也促进了web访问行为规律分析、个性化推荐和网站结构优化等方面的实际研究。关键词:web使用挖掘,会话识别,K-means算法,层次聚类算法rn●··‘111‘一·一lneconversationidentificationmethOdresearchofWEBusageminingAbstractInrecentyears,withtheinternet,especiallyelectronic.co

4、mmercerapiddevel.oped,theinformationonwebappears‘‘explosive’’growth,andthenetworkhasbeguntograduallychangepeople’Shabitsandworkmethods,thisalsoprovidenewmarketsandmarketstrategyforbusinesses.W曲usageminingmainlybyanalysiswebserverlogs,byanalysisthebrowsebehaviorofnetworkerusers,andthenfind

5、usefulinfor.mationandpa:ttemsofhiddenuser.Toguildthevalidityandrelevanceofelec.tric-commerceactivities,suchaswebdesign,personalizedserviceandbusinessdeci.sions.andSOon.Conversationidentificationisnotonlythedi伍cultyofwebusagemining,butalsothefoundationandkeyworkofuseraccessbehavior,itsqual

6、ityhasadecisiveinfluenceonaccuracyofwebusagemining.Inviewoflimitationofthecur.rentconversationidentificationmethod,thisPaperdepthresearchinconversationidentificationrespectivelyfromtheclusteringanduseraccessbehaviorcharacteris.tics.Ontheonehand,thepaperaimedatthedivideconversationshortage

7、whichbasedonheuristicalgorithmbefore.Passtosetupdefinitelyoptimizationmodeltodividetheconversationbytheclusterperspective.nleimprovedK.meansclusteringalgorithmisusedforclusteringconversation.AccordingtostatisticsdeterminetheinitialclusteringcentersandKvalue,thenimpr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。