欢迎来到天天文库
浏览记录
ID:33382166
大小:4.05 MB
页数:56页
时间:2019-02-25
《web使用挖掘中会话识别方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、合肥工业大学硕士学位论文WEB使用挖掘中会话识别方法研究姓名:余笪申请学位级别:硕士专业:管理科学与工程指导教师:凌海峰201204WEB使用挖掘中会话识别方法研究摘要随着互联网,特别是近年来电子商务的迅猛发展,使得web上的信息呈现“爆炸式”增长,网络已经开始逐步改变人们的生活习惯和工作方式,这也为商家提供了新的市场和营销策略。Web使用挖掘主要是通过对web服务器中日志的分析,通过对网络用户浏览行为的分析发现隐藏的用户有用信息或模式。从而指导电子商务活动的有效性和针对性,如网站设计、个性化服务和商业决策等。会话识别不仅是web使用挖掘的难点,同时也是用户访问行为分析的
2、基础和关键工作,其质量对于web使用挖掘结果的准确度具有决定性的影响。针对目前常用的会话识别方法的局限性,本文分别从聚类和用户访问行为特点的角度对会话识别进行深入研究。一方面,针对以前基于启发式算法划分会话的不足,从聚类的角度来通过构建一定的优化模型来划分会话。利用改进的K-means聚类算法进行会话聚类。根据统计学的知识确定了初始聚类中心点和K值,再根据一个会话中记录时间有序性的特点改进算法,提高了算法的准确度。另一方面,根据用户访问行为的特点,采用合并和拆分的会话识别算法。利用层次聚类算法的基本思想实现会话的合并,再经过会话的二次识别将合并的会话进行必要的拆分,从而增
3、加了会话识别的准确度。本文对会话识别算法的研究具有一定程度的现实意义。首先,它将聚类算法应用到会话识别领域具有一定的参考价值,在一定程度上丰富了聚类算法的应用领域;其次,它也促进了web访问行为规律分析、个性化推荐和网站结构优化等方面的实际研究。关键词:web使用挖掘,会话识别,K-means算法,层次聚类算法rn●··‘111‘一·一lneconversationidentificationmethOdresearchofWEBusageminingAbstractInrecentyears,withtheinternet,especiallyelectronic.co
4、mmercerapiddevel.oped,theinformationonwebappears‘‘explosive’’growth,andthenetworkhasbeguntograduallychangepeople’Shabitsandworkmethods,thisalsoprovidenewmarketsandmarketstrategyforbusinesses.W曲usageminingmainlybyanalysiswebserverlogs,byanalysisthebrowsebehaviorofnetworkerusers,andthenfind
5、usefulinfor.mationandpa:ttemsofhiddenuser.Toguildthevalidityandrelevanceofelec.tric-commerceactivities,suchaswebdesign,personalizedserviceandbusinessdeci.sions.andSOon.Conversationidentificationisnotonlythedi伍cultyofwebusagemining,butalsothefoundationandkeyworkofuseraccessbehavior,itsqual
6、ityhasadecisiveinfluenceonaccuracyofwebusagemining.Inviewoflimitationofthecur.rentconversationidentificationmethod,thisPaperdepthresearchinconversationidentificationrespectivelyfromtheclusteringanduseraccessbehaviorcharacteris.tics.Ontheonehand,thepaperaimedatthedivideconversationshortage
7、whichbasedonheuristicalgorithmbefore.Passtosetupdefinitelyoptimizationmodeltodividetheconversationbytheclusterperspective.nleimprovedK.meansclusteringalgorithmisusedforclusteringconversation.AccordingtostatisticsdeterminetheinitialclusteringcentersandKvalue,thenimpr
此文档下载收益归作者所有