基于搜索历史的用户兴趣建模.pdf

基于搜索历史的用户兴趣建模.pdf

ID:57745398

大小:6.70 MB

页数:54页

时间:2020-03-27

基于搜索历史的用户兴趣建模.pdf_第1页
基于搜索历史的用户兴趣建模.pdf_第2页
基于搜索历史的用户兴趣建模.pdf_第3页
基于搜索历史的用户兴趣建模.pdf_第4页
基于搜索历史的用户兴趣建模.pdf_第5页
资源描述:

《基于搜索历史的用户兴趣建模.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于搜索日志的用户兴趣建模基于搜索历史的用户兴趣建模院系计算机科学技术专业计算机应用技术姓名王宇攻读学位理学硕士指导教师牛军钮副教授指导小组牛军钮沙朝峰陈海光基于搜索日志的用户兴趣建模摘要随着信息技术的不断发展,人们对个性化服务的需求越来越高。而目前的搜索引擎在进行查询一文档匹配时,并没有针对不同的用户作相应的处理。对同一个查询词,不同用户得到的查询结果是相同的,即便他们的兴趣和背景有着巨大的差异。这使得这些传统的信息检索技术不能很好地提供吻合用户个人需求的搜索结果。面对海量的网络信息,如何抓住用户的个人兴趣,为用户提供个性化服务已经成为当前W亡b技术研究的一个重要主

2、题。个性化服务中,建立用户兴趣模型是至关重要的步骤。兴趣模型的好坏直接影响了个性化服务提供的准确性和有效性。用户兴趣建模的目标是从用户的历史记录数据中挖掘出有价值的数据,并用合适的模型来进行表示。本文的工作主要包括:.本文介绍了用户兴趣建模的研究现状,详细介绍了一些常见的模型计算方法,指出了现有方法的局限性。.提出了基于搜索历史的用户兴趣建模方法,通过从搜索引擎的搜索日志中获取用户信息进行兴趣建模。.提出了综合最近检索词向量,历史检索关键词向量,文档中心向量和类别特征树的用户兴趣模型。在模型计算过程中,根据搜索行为本身的特点,在传统的中文分词和文档向量模型作了改进。在

3、通过检索分类计算类别特征时,采用了分类器和自聚类相结合的分类方法,得到的分类结果在互联网语料中更加准确。.提出了基于用户兴趣模型的个性化检索方案,包括检索词扩展和网页排序等。关键词:用户兴趣个性化检索搜索日志中图分类号:丁P3基于搜索日志的用户兴趣建模AbstraetAsinformationtechnologycontinuestoevolve,theneedforPersonalizedservices15growingfaster.Currently,searchenginesystemsusuallyProvidesearchresultsbyealeulat

4、ingthesimilarityofinPutqueriesanderawleddoeuments,duringwhichtheusers’Personalbaekgroundandinterestarenottakenintoaecount.Thusdifferentusersgetthesamequeryresultaslongastheysubxnitthesamequery,eveniftheyhaveverydifferentinterestsandbackgrounds.Thismakesthetraditionalinformationretrieval

5、techniqueshardtomeetindividualneeds.Faeingmassivenetworkinformation,howtoseizetheuser,5Personalinterests,toProvideuserswithPersonalized认七bservieesteehnologyhasbecomeanimPortantresearehtoPie.Theereationofuserinterestmodel15aerueialstePinPersonalizedservices.Thequalityoftheuserinterestmod

6、eleffeetdirectlytheaceuraeyandeffeetivenessofthePersonalizedservieedelivery.Thegoalofmodelinguserinterest15todiginformationofuser’5interestfromhistoricaldataandthenusetheaPProPriatemodelrePresent.InthisPaPer,auserinterestmodelingmethodbasedonusersearchhistory15brought.Auserinterestmodel

7、15ealeulatedbyextractinformationfromuser,sseareh1095andelickdoeumentation.Chinesewordsegmentation,documentveetormodelandthetextelusteringandothermethodsareusedintheProcess.Theuserinterestmodel15constitutedbyareeentsearehwordveetor,ahistorysearehkeywordsvector,adoeu一nentcenterve

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。