欢迎来到天天文库
浏览记录
ID:57745398
大小:6.70 MB
页数:54页
时间:2020-03-27
《基于搜索历史的用户兴趣建模.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于搜索日志的用户兴趣建模基于搜索历史的用户兴趣建模院系计算机科学技术专业计算机应用技术姓名王宇攻读学位理学硕士指导教师牛军钮副教授指导小组牛军钮沙朝峰陈海光基于搜索日志的用户兴趣建模摘要随着信息技术的不断发展,人们对个性化服务的需求越来越高。而目前的搜索引擎在进行查询一文档匹配时,并没有针对不同的用户作相应的处理。对同一个查询词,不同用户得到的查询结果是相同的,即便他们的兴趣和背景有着巨大的差异。这使得这些传统的信息检索技术不能很好地提供吻合用户个人需求的搜索结果。面对海量的网络信息,如何抓住用户的个人兴趣,为用户提供个性化服务已经成为当前W亡b技术研究的一个重要主
2、题。个性化服务中,建立用户兴趣模型是至关重要的步骤。兴趣模型的好坏直接影响了个性化服务提供的准确性和有效性。用户兴趣建模的目标是从用户的历史记录数据中挖掘出有价值的数据,并用合适的模型来进行表示。本文的工作主要包括:.本文介绍了用户兴趣建模的研究现状,详细介绍了一些常见的模型计算方法,指出了现有方法的局限性。.提出了基于搜索历史的用户兴趣建模方法,通过从搜索引擎的搜索日志中获取用户信息进行兴趣建模。.提出了综合最近检索词向量,历史检索关键词向量,文档中心向量和类别特征树的用户兴趣模型。在模型计算过程中,根据搜索行为本身的特点,在传统的中文分词和文档向量模型作了改进。在
3、通过检索分类计算类别特征时,采用了分类器和自聚类相结合的分类方法,得到的分类结果在互联网语料中更加准确。.提出了基于用户兴趣模型的个性化检索方案,包括检索词扩展和网页排序等。关键词:用户兴趣个性化检索搜索日志中图分类号:丁P3基于搜索日志的用户兴趣建模AbstraetAsinformationtechnologycontinuestoevolve,theneedforPersonalizedservices15growingfaster.Currently,searchenginesystemsusuallyProvidesearchresultsbyealeulat
4、ingthesimilarityofinPutqueriesanderawleddoeuments,duringwhichtheusers’Personalbaekgroundandinterestarenottakenintoaecount.Thusdifferentusersgetthesamequeryresultaslongastheysubxnitthesamequery,eveniftheyhaveverydifferentinterestsandbackgrounds.Thismakesthetraditionalinformationretrieval
5、techniqueshardtomeetindividualneeds.Faeingmassivenetworkinformation,howtoseizetheuser,5Personalinterests,toProvideuserswithPersonalized认七bservieesteehnologyhasbecomeanimPortantresearehtoPie.Theereationofuserinterestmodel15aerueialstePinPersonalizedservices.Thequalityoftheuserinterestmod
6、eleffeetdirectlytheaceuraeyandeffeetivenessofthePersonalizedservieedelivery.Thegoalofmodelinguserinterest15todiginformationofuser’5interestfromhistoricaldataandthenusetheaPProPriatemodelrePresent.InthisPaPer,auserinterestmodelingmethodbasedonusersearchhistory15brought.Auserinterestmodel
7、15ealeulatedbyextractinformationfromuser,sseareh1095andelickdoeumentation.Chinesewordsegmentation,documentveetormodelandthetextelusteringandothermethodsareusedintheProcess.Theuserinterestmodel15constitutedbyareeentsearehwordveetor,ahistorysearehkeywordsvector,adoeu一nentcenterve
此文档下载收益归作者所有