欢迎来到天天文库
浏览记录
ID:35101939
大小:3.12 MB
页数:83页
时间:2019-03-17
《面向url的用户建模关键技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文面向URL的用户建模关键技术研究THERESEARCHONTHEKEYTECHNOLOGYOFUSERMODELINGBASE-ONURL黎斌哈尔滨工业大学2016年6月国内图书分类号:TP391.1学校代码:10213国际图书分类号:004.93密级:公开工学硕士学位论文面向URL的用户建模关键技术研究硕士研究生:黎斌导师:王佰玲教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2016年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.1U.D.C:004.93DissertationfortheMasterDe
2、greeinEngineeringTHERESEARCHONTHEKEYTECHNOLOGYOFUSERMODELINGBASE-ONURLCandidate:LiBinSupervisor:Prof.WangBailingAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2016Degree-Conferring-Institution:H
3、arbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要在互联网高速发展的背景下,网络应用和网络信息种类繁多,不同用户对信息及服务的需求不同,为了给用户提供具有针对性的信息和服务,个性化服务应运而生。用户建模是个性化服务的关键部分,因此用户建模技术对于了解和刻画用户,以及为用户提供更加优质的服务具有重要的研究价值。用户访问的网站对用户建模具有非常重要的作用。传统的Web用户建模方法大多数建立在挖掘用户访问的网页内容之上,但是由于获取网页内容十分耗时,而且挖掘网页内容中的信息具有一定难度,使得基于网页内容的用户建模方法具有一定局限性。而采用URL对用户建模具有
4、耗时短、处理简单等优点。本文尝试通过深入分析URL来建立用户兴趣模型和用户属性模型,其中用户兴趣模型能够描述用户的兴趣偏好,用户属性模型能够描述用户属性信息。在用户兴趣建模的过程中,用户对某个主题的网站的访问频率能够反映用户对该主题的兴趣程度,所以网页主题分类对确定用户兴趣具有重要作用。本文在只利用URL的情况下,引入了N-gram语言模型对网页进行分类。并提出了一种基于URL的用户兴趣建模方法,该方法通过URL进行网页主题分类,得到用户主题兴趣信息,进而通过用户兴趣建模算法建立用户兴趣模型。在用户属性建模的过程中,本文提出了一种基于URL的用户属性建模方法,即通过深入分析URL,通过构
5、建URL规则挖掘URL中的用户属性信息,然后利用模型构建和更新方法建立用户属性模型,最后给出了一种建模的并行化方案。利用本文的研究方法,设计并实现了一个基于URL的用户建模系统,并利用VPN用户群体的访问日志进行了实验,实验表明系统能够从大量的URL中快速挖掘用户兴趣和用户属性信息,构建用户兴趣模型和用户属性模型,同时系统具有较强的稳定性和高效的性能。关键词:用户建模;用户兴趣建模;用户属性建模;URL分类-I-哈尔滨工业大学工学硕士学位论文AbstractWiththerapiddevelopmentoftheInternet,thetypesofnetworkapplications
6、andnetworkinformationaregraduallyincreasing,anddifferentusers'demandforinformationorservicesisdifferent.Inordertoprovideuserswithtargetedinformationandservices,personalizedservicecameintobeing.Usermodelingisthekeypartofpersonalizedservice,sousermodelingtechnologyhasimportantresearchvalueforunders
7、tandingandcharacterizingofusers,aswellasprovidinguserswithmorequalityservices.Thewebsitesthatuserhasvisitedhaveaveryimportantroleinmodeling.MostofthetraditionalWebusermodelingmethodsarebasedontheminingtothewebpageconte
此文档下载收益归作者所有