基于用户个性化特征的微博搜索结果优化

基于用户个性化特征的微博搜索结果优化

ID:35067953

大小:2.74 MB

页数:58页

时间:2019-03-17

基于用户个性化特征的微博搜索结果优化_第1页
基于用户个性化特征的微博搜索结果优化_第2页
基于用户个性化特征的微博搜索结果优化_第3页
基于用户个性化特征的微博搜索结果优化_第4页
基于用户个性化特征的微博搜索结果优化_第5页
资源描述:

《基于用户个性化特征的微博搜索结果优化》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于用户个性化特征的微博搜索结果优化OptimizationAlgorithmofRetrievalResultinMicroblogbasedonUserPersonalization学科专业:计算机科学与技术研究生:缑小路指导教师:喻梅副教授天津大学计算机科学与技术学院二零一五年十二月摘要近年来,互联网技术和信息技术的飞速发展使得通过网络进行通信的网络社交成为可能。在众多的社会网络平台中,微博成为了使用广泛、最受人们欢迎和研究学者关注的社交平台,微博搜索服务在实时性方面也得到了人们的认可。然而,经过大量的研究分析发现,

2、在以人为本,追求个性化服务的今天,微博搜索服务并没有做到个性化搜索,造成了浪费丰富的微博用户信息资源的同时,搜索结果有些不尽人意的后果。对大量的搜索引擎技术进行研究后发现,查询扩充机制可以有效的提高搜索查询的准确率。论文基于以上发现,提出一种基于用户个性化特征的微博搜索结果优化算法。由于目前微博搜索引擎相对完善,其搜索结果具有一定的可靠性,因此论文假设微博搜索引擎得到的搜索结果的前N页包含所有与查询词相关的文档内容。基于这一假设,论文使用主题模型分析和提取用户的兴趣,结合这一用户兴趣和加权关联规则算法对查询词进行语义关联扩

3、充。使用传统的相似性计算方法TF-IDF计算查询词与微博搜索文档的相似度,再结合微博平台时效性的特点共同作为文档重新排序的评分依据,进而优化微博搜索结果。论文的实验以微博平台用户的发布、转发等信息为数据集,以微博搜索引擎的搜索结果为基准结果,以基于词典的查询扩充方法优化微博搜索结果的实验,基于关联规则的查询扩充方法优化微博搜索结果的实验作为对比实验,对论文提出的基于用户个性化特征的微博搜索结果优化算法进行分析。实验结果表明,论文提出的基于个性化特征的微博搜索结果优化算法相比于基准结果和以上两种对比实验在搜索准确率上有明显的

4、提高。关键词:加权关联规则,主题模型,查询扩充机制,微博个性化搜索IABSTRACTInrecentyears,therapiddevelopmentofInternettechnologyandinformationtechnologymakesitpossibletocommunicatethroughthenetwork.Amongnumeroussocialnetworkplatforms,microbloghasbecomeasocialplatformwhichhasbeenwidelyused,themost

5、popularandresearchscholarsareconcernedon.Andintermsofrealtime,themicroblogretrievalservicehasbeenapproved.However,afteralargenumberofresearchandanalysis,wecouldfindthatmicroblogretrievalservicedoesnotdopersonalizedsearchintoday’speople-orientedandthepursuitofperso

6、nalizedservice,resultinginawasteofinformationresourcesoftherichmicrobloggingusers,andretrievalresultsaresomewhatunsatisfactory.Studyingalargenumberofretrievalenginetechnology,weacknowledgethatthequeryexpansionmechanismcaneffectivelyimprovetheaccuracyofquery.Basedo

7、ntheabovefindings,thisthesispresentsanewalgorithmfortheoptimizationofmicroblogretrievalresultsbasedonuserpersonalizedfeatures.Thisalgorithmassumesthattheretrievalresultsofthemicroblogretrievalenginecontainsallthedocumentsrelatedtothequeryterms.Basedonthisassumptio

8、n,thethesisusesTopicModelandweightedassociationrulestoexpandthesemanticrelevanceofthequeryterms.UsingthetraditionalsimilaritycalculationmethodTF-IDFtoge

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。