欢迎来到天天文库
浏览记录
ID:57744240
大小:4.67 MB
页数:58页
时间:2020-03-27
《基于WEB日志的用户行为分析与挖掘.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、学校代码:10255学号:2081095基于WEB日志的用户行为分析与挖掘UserBehaviorAnalysisandMiningBasedonWebLog学科专业:计算机软件与理论作者:奚杰指导教师:乐嘉锦答辩日期:2011年1月2010年12月基于WEB日志的用户行为分析与挖掘大学学位论文原创性声明本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中己明确注明和引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的作品及成果的内容。论文为本人亲自撰写,我对所写的内容负责,并完
2、全意识到本声明的法律结果由本人承担。学位论文作者签名:襄意日期:加//年/月/D日基于WEB日志的用户行为分析与挖掘大学学位论文版权使用授权书学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于保密口,在年解密后适用本版权书。不保密学位论文作者签名:炙扔日期:加f1年1月fD日指导教师签名:日期:月f『年f月f0日基于WEB日志的用户
3、行为分析与挖掘摘要随着Web2.0时代的到来,网络己成为人们获取各种信息和资源的重要途径。商业、企业、政府、教育等机构不断加速在万维网上的数据积累,存储了海量的数据信息。万维网已然成为全世界最丰富和最密集的信息存储及交换的场所。面对如此宝贵的资源,如何分析蕴藏在其中的信息和知识,挖掘用户行为并加以有效利用,是当前互联网企业的关键需求之一。Web数据挖掘旨在运用数据挖掘技术,通过对Web日志和用户行为的分析,挖掘有用的知识及背后的规律模式,从而解决上述问题。本文详细阐述了从Web数据挖掘到用户行为分析的整个过程。主要研究工作如下:1)介绍和分析了Web数据预
4、处理技术,包括数据清理、会话识别、事物识别等关键步骤。分析网页和点击次数的关系,计算关键字和链接之间的相似度,提出一种改进的相似度算法,提高关联规则算法的精确度。2)利用基于聚类分析的方法识别用户行为模式,并在传统的模型中引入时间等因素,检测突发事件,以反映用户兴趣随时间的变化规律。实验结果证明,本文所提出的改进方案能够有效的分析用户意图,基于WEB日志的用户行为分析与挖掘挖掘用户行为规律。且与传统的技术相比,其准确度和效率均有所提高。本文所提出的各项改进方案均可以直接或部分修改后应用于不同类型资源的系统中,因此本研究成果具有一定的普遍意义。关键词:数据挖
5、掘;Web日志;用户行为;关联规则;聚类基于WEB日志的用户行为分析与挖掘UserBehaviorAnalysisandMiningBasedonWebLogABSTRACTWiththeemergenceofWeb2.0era,theIntemethasbecomesuchanimportantchannelforpeopletoobtainallsortsofinformationandresourcesthroughouttheworld.Agenciesofbusiness,enterprise,governmentandeducationarea
6、cceleratingtheaccumulationofvastamountsofdatastoredOllit.Internethasbecomeoneoftherichestandmostdenseplacesforinformationstorageandexchange.Facedwithsuchavaluableresource,howtoobtain,analyzeandminingtheknowledgeanduserbehaviorhasbecomeoneofthecriticalrequirementsforIntemetCompany.
7、TheproposalofWebdataminingistobringaboutaileffectivesolutionaddressingtheabove—mentionedrequirement.Aimingatanalyzingweblogsanduserbehavior,itcanidentifyanddiscovervaluableknowledgeandpattemsusingdataminingtechniques.Thisthesishasconductedin-depthstudyonthewholeprocedureofdatamiIl
8、iIlgbeginningfromweblogminingtous
此文档下载收益归作者所有