欢迎来到天天文库
浏览记录
ID:33716915
大小:2.58 MB
页数:58页
时间:2019-02-28
《用户兴趣模型驱动的个性化搜索引擎的研究和实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号TP391密级用户兴趣模型驱动的个性化搜索引擎的研究和实现研究生姓名:王苏指导教师姓名、职称:刘丰年副教授副指导教师姓名、职称:马革新讲师学科专业:计算机应用技术研究方向:搜索引擎湖南工业大学二〇一四年五月三十一日万方数据万方数据万方数据摘要作为互联网的重要入口,搜索引擎地位不言而喻。而众多搜索引擎有着同样的外表,搜索结果严重同质化。个性化搜索引擎通过为用户建立兴趣模型并根据已获得的用户兴趣特征及其历史查询对查询词进行优化扩展,为用户返回量身定做的查询结果,成为搜索领域重要的研究趋势。针对个性
2、化搜索引擎不能有效描述用户兴趣特征、查询扩展会造成“扩展词漂移”2个关键科技问题,论文主要研究工作如下:(1)在用户兴趣模型中,针对传统的TF-IDF并未考虑到关键词的位置会对其重要程度的影响,也未区分用户对网页的喜好程度。论文提出了基于改进TF-IDF的用户兴趣建模方法。实验表明,改进的建模方法不仅能够为用户建立兴趣模型还能够进行实时的更新,能够准确描述用户特征,符合为用户建立兴趣模型的要求。(2)在以往的查询扩展中,严重依赖初始查询结果且需要用户的参与,但是往往初始查询结果的相关度并不高造成查询
3、扩展的漂移,使查询不准确。针对上述问题提出了查询扩展的方法:利用用户对于所查看网页的兴趣度等信息,选择用户兴趣度的高的历史查询文件作为候选的查询词文档集,并结合用户兴趣模型对查询词进行扩展。实验表明,本文提出的方法在查询时的平均准确率比无扩展的方法和基于局部上下文的查询扩展方法要高。关键字:搜索引擎,用户兴趣模型,查询扩展,个性化I万方数据ABSTRACTAsanimportantentranceoftheInternet,thesearchenginesplayanimportantroleint
4、heInternet.Manysearchengineshavethesameappearance,resultsserioushomogeneity.Personalizedsearchenginefortheuserinterestmodelisestablishedandaccordingtothecharacteristicsofuser'sinterestshavebeenobtainedanditshistoryqueryoptimizethequeryexpansion,tailor-
5、madeforuserstoreturntothequeryresults,becominganimportantdevelopmentofthesearchfield.Forpersonalizedsearchenginecannotdescribethecharacteristicsofuser'sinterests,queryexpansionwillcause"extensionsworddrift"twokeytechnologyproblems,itconductedthefollowi
6、ngwork:(1)Intheuserinterestmodel,thetraditionalTF-IDFdidn’ttakethelocationofthekeywordsintoaccounttoitsimportance,notdistinguishbetweenuser'spreferencesinthewebpage.ThepaperproposethemethodthatbasedonadaptiveTF-IDFtoimprovethemethodofbuildingtheuserint
7、erestmodel.Experimentsshowthat,theimprovedmodelingmethodcannotonlytobuildtheuserinterestbutalsocanreal-timeupdate,itconformedtotherequirementofbuildinguserinterestmodel.(2)Inthequeryexpansionofthepast,dependedontheinitialqueryresultsandrequiredtheparti
8、cipationofusersheavily.Buttheinitialqueryresultshadthelowcorrelationledtothequeryexpansiondrift.Improvedqueryexpansionmethodisproposedfortheproblem:takeadvantageoftheinformationsuchastheinterestdegree,selectthehistoryqueryfilethathadthe
此文档下载收益归作者所有