欢迎来到天天文库
浏览记录
ID:33101242
大小:6.40 MB
页数:63页
时间:2019-02-20
《基于web日志的数据挖掘技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号UDC密级学号、砂挤争了,去军硕士学位论文基于Web日志的数据挖掘技术研究姚梦涛学科名称:系统工程学科门类:工学指导教师:王新房教授申请日期:2010年3月独创性声明本人所呈交的学位论文是在导师指导下进行的研究工作及取得的成果。尽我所知,除特别加以标注的地方外,论文中不包含其他人的研究成果。与我一同工作的同志对本文的研究工作和成果的任何贡献均已在论文中作了明确的说明并已致谢。本论文及其相关资料若有不实之处,由本人承担一切相关责任论文作者签名:』生生宣…;0)。钊月‘日学位论文使用授权声明本人崖叁生泣在导师的指导下创作完成学位论文的知识产权归西安理工大学所有,本人
2、今后在使用或发表该论文涉及的研究内容时,会注明西安理工大学。本人作为学位论文著作权拥有者,同意授权西安理工大学拥有学位论文的部分使用权(在以下“口”中标明,同意的划“扩”,不同意的划“x,’),即:本人提交的印刷版和电子版学位论文,口学校可以采用影印、缩印或其他复制手段保存;口学校可以将学位论文的全部内容编入公开的数据库进行检索;白学校可以将学位论文的摘要编入公开的数据库进行检索;口学校可以将公开的学位论文或解密后的学位论文作为资料在图书馆、资料室等场所及校园网上供校内师生阅读、浏览。本人学位论文全部或部分内容的公布(包括刊登)授权西安理工大学研究生学院办理。(保密的
3、学位论文在解密后,适用本授权说明)论娇者娜:塑丝透导师签名:“)口年;月石日/摘要论文题目:基于Web日志的数据挖掘技术研究学科专业:系统工程研究生:姚梦涛签名:垫匕赎涛指导教师:王新房签名:声革、摘要随着工nternet的迅猛发展和互联网用户的不断增加,当前基于网络的电子商务信息系统也得到了前所未有的发展。有效利用网上丰富的数据资源,及时快速的发现有用信息,向用户提供感兴趣的信息服务,便成为广大研究人员值得研究的课题。Web使用挖掘技术就是在这个大背景下产生和发展起来的。Web使用挖掘又称为Web日志挖掘,由于Web日志记录了用户对web站点的访问信息,通过对这些访
4、问信息的分析可以发现用户访问站点的习惯和浏览模式,从而对优化网站结构,以及在电子商务过程中增加一些个性化服务提供了理论上的可能。本文首先对数据挖掘技术和个性化推荐技术进行了重点介绍,在分析和研究传统个性化推荐算法的缺陷和推荐质量问题的基础上,提出了一种新颖、有效的数据挖掘方法。其次,本文详细介绍和探讨了基于Web日志的数据挖掘的一般过程,重点探讨了数据的预处理过程。为了验证提出算法的优越性,本文在第5章专门设计了一个挖掘算法对比实验。分别采用MovieLens数据集和自制模拟数据进行仿真实验。挖掘结果表明,在数据极端稀疏的情况下,基于项目的协同过滤推荐方法明显的提高了
5、推荐质量。同时,本文还架设了一个图书推荐网站,直观的反应了文中提出算法的推荐效果。在最后一章中,笔者总结了本课题的内容和主要工作,展望了未来工作的研究方向。关键词:数据挖掘技术;协同过滤推荐技术;Web使用挖掘;个性化推荐;相似性;平均绝对偏差夕西安理工大学硕士学位论文T厅t!6:RESEARCHOFDATAMININGTECHNOLOGYBASEDONWEBLOGMajor:SystemEngineeringName:MengtaoYAOS’gna,u『e:卿钾血SuPervisor:Prof.XinfangWANG5ignature:Abst门CtWithther
6、apiddeveloPmentofInternetandInternetusersincreasing,theeurentWeb一basede一eonuereeinformationsystemhasalsogotanunPreeedenteddeveloPment.Efeetiveuseoftheabundantdataresourees,thetimelyandraPiddiseoveryofusefulinformation,andProvideinformationofinteresttousers,whichhavebeeomethetoPiestobest
7、udiedforthevastnumberofresearehers.AndWebusageminingtechnologywasbornanddeveloPedinthiscontext.Webusagemining,alsoknownasWeb109mining.AsWeb109reeordstheinformationofuser,5aeeesstotheWebsite,Users’browsinghabitsandmodelseanbefoundthroughtheanalysistotheinformationoftheaceess.Thu
此文档下载收益归作者所有