用户兴趣模型驱动的个性化搜索引擎的研究和实现

用户兴趣模型驱动的个性化搜索引擎的研究和实现

ID:33716915

大小:2.58 MB

页数:58页

时间:2019-02-28

用户兴趣模型驱动的个性化搜索引擎的研究和实现_第1页
用户兴趣模型驱动的个性化搜索引擎的研究和实现_第2页
用户兴趣模型驱动的个性化搜索引擎的研究和实现_第3页
用户兴趣模型驱动的个性化搜索引擎的研究和实现_第4页
用户兴趣模型驱动的个性化搜索引擎的研究和实现_第5页
资源描述:

《用户兴趣模型驱动的个性化搜索引擎的研究和实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号TP391密级用户兴趣模型驱动的个性化搜索引擎的研究和实现研究生姓名:王苏指导教师姓名、职称:刘丰年副教授副指导教师姓名、职称:马革新讲师学科专业:计算机应用技术研究方向:搜索引擎湖南工业大学二〇一四年五月三十一日万方数据万方数据万方数据摘要作为互联网的重要入口,搜索引擎地位不言而喻。而众多搜索引擎有着同样的外表,搜索结果严重同质化。个性化搜索引擎通过为用户建立兴趣模型并根据已获得的用户兴趣特征及其历史查询对查询词进行优化扩展,为用户返回量身定做的查询结果,成为搜索领域重要的研究趋势。针对个性

2、化搜索引擎不能有效描述用户兴趣特征、查询扩展会造成“扩展词漂移”2个关键科技问题,论文主要研究工作如下:(1)在用户兴趣模型中,针对传统的TF-IDF并未考虑到关键词的位置会对其重要程度的影响,也未区分用户对网页的喜好程度。论文提出了基于改进TF-IDF的用户兴趣建模方法。实验表明,改进的建模方法不仅能够为用户建立兴趣模型还能够进行实时的更新,能够准确描述用户特征,符合为用户建立兴趣模型的要求。(2)在以往的查询扩展中,严重依赖初始查询结果且需要用户的参与,但是往往初始查询结果的相关度并不高造成查询

3、扩展的漂移,使查询不准确。针对上述问题提出了查询扩展的方法:利用用户对于所查看网页的兴趣度等信息,选择用户兴趣度的高的历史查询文件作为候选的查询词文档集,并结合用户兴趣模型对查询词进行扩展。实验表明,本文提出的方法在查询时的平均准确率比无扩展的方法和基于局部上下文的查询扩展方法要高。关键字:搜索引擎,用户兴趣模型,查询扩展,个性化I万方数据ABSTRACTAsanimportantentranceoftheInternet,thesearchenginesplayanimportantroleint

4、heInternet.Manysearchengineshavethesameappearance,resultsserioushomogeneity.Personalizedsearchenginefortheuserinterestmodelisestablishedandaccordingtothecharacteristicsofuser'sinterestshavebeenobtainedanditshistoryqueryoptimizethequeryexpansion,tailor-

5、madeforuserstoreturntothequeryresults,becominganimportantdevelopmentofthesearchfield.Forpersonalizedsearchenginecannotdescribethecharacteristicsofuser'sinterests,queryexpansionwillcause"extensionsworddrift"twokeytechnologyproblems,itconductedthefollowi

6、ngwork:(1)Intheuserinterestmodel,thetraditionalTF-IDFdidn’ttakethelocationofthekeywordsintoaccounttoitsimportance,notdistinguishbetweenuser'spreferencesinthewebpage.ThepaperproposethemethodthatbasedonadaptiveTF-IDFtoimprovethemethodofbuildingtheuserint

7、erestmodel.Experimentsshowthat,theimprovedmodelingmethodcannotonlytobuildtheuserinterestbutalsocanreal-timeupdate,itconformedtotherequirementofbuildinguserinterestmodel.(2)Inthequeryexpansionofthepast,dependedontheinitialqueryresultsandrequiredtheparti

8、cipationofusersheavily.Buttheinitialqueryresultshadthelowcorrelationledtothequeryexpansiondrift.Improvedqueryexpansionmethodisproposedfortheproblem:takeadvantageoftheinformationsuchastheinterestdegree,selectthehistoryqueryfilethathadthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。