欢迎来到天天文库
浏览记录
ID:35067953
大小:2.74 MB
页数:58页
时间:2019-03-17
《基于用户个性化特征的微博搜索结果优化》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于用户个性化特征的微博搜索结果优化OptimizationAlgorithmofRetrievalResultinMicroblogbasedonUserPersonalization学科专业:计算机科学与技术研究生:缑小路指导教师:喻梅副教授天津大学计算机科学与技术学院二零一五年十二月摘要近年来,互联网技术和信息技术的飞速发展使得通过网络进行通信的网络社交成为可能。在众多的社会网络平台中,微博成为了使用广泛、最受人们欢迎和研究学者关注的社交平台,微博搜索服务在实时性方面也得到了人们的认可。然而,经过大量的研究分析发现,
2、在以人为本,追求个性化服务的今天,微博搜索服务并没有做到个性化搜索,造成了浪费丰富的微博用户信息资源的同时,搜索结果有些不尽人意的后果。对大量的搜索引擎技术进行研究后发现,查询扩充机制可以有效的提高搜索查询的准确率。论文基于以上发现,提出一种基于用户个性化特征的微博搜索结果优化算法。由于目前微博搜索引擎相对完善,其搜索结果具有一定的可靠性,因此论文假设微博搜索引擎得到的搜索结果的前N页包含所有与查询词相关的文档内容。基于这一假设,论文使用主题模型分析和提取用户的兴趣,结合这一用户兴趣和加权关联规则算法对查询词进行语义关联扩
3、充。使用传统的相似性计算方法TF-IDF计算查询词与微博搜索文档的相似度,再结合微博平台时效性的特点共同作为文档重新排序的评分依据,进而优化微博搜索结果。论文的实验以微博平台用户的发布、转发等信息为数据集,以微博搜索引擎的搜索结果为基准结果,以基于词典的查询扩充方法优化微博搜索结果的实验,基于关联规则的查询扩充方法优化微博搜索结果的实验作为对比实验,对论文提出的基于用户个性化特征的微博搜索结果优化算法进行分析。实验结果表明,论文提出的基于个性化特征的微博搜索结果优化算法相比于基准结果和以上两种对比实验在搜索准确率上有明显的
4、提高。关键词:加权关联规则,主题模型,查询扩充机制,微博个性化搜索IABSTRACTInrecentyears,therapiddevelopmentofInternettechnologyandinformationtechnologymakesitpossibletocommunicatethroughthenetwork.Amongnumeroussocialnetworkplatforms,microbloghasbecomeasocialplatformwhichhasbeenwidelyused,themost
5、popularandresearchscholarsareconcernedon.Andintermsofrealtime,themicroblogretrievalservicehasbeenapproved.However,afteralargenumberofresearchandanalysis,wecouldfindthatmicroblogretrievalservicedoesnotdopersonalizedsearchintoday’speople-orientedandthepursuitofperso
6、nalizedservice,resultinginawasteofinformationresourcesoftherichmicrobloggingusers,andretrievalresultsaresomewhatunsatisfactory.Studyingalargenumberofretrievalenginetechnology,weacknowledgethatthequeryexpansionmechanismcaneffectivelyimprovetheaccuracyofquery.Basedo
7、ntheabovefindings,thisthesispresentsanewalgorithmfortheoptimizationofmicroblogretrievalresultsbasedonuserpersonalizedfeatures.Thisalgorithmassumesthattheretrievalresultsofthemicroblogretrievalenginecontainsallthedocumentsrelatedtothequeryterms.Basedonthisassumptio
8、n,thethesisusesTopicModelandweightedassociationrulestoexpandthesemanticrelevanceofthequeryterms.UsingthetraditionalsimilaritycalculationmethodTF-IDFtoge
此文档下载收益归作者所有