欢迎来到天天文库
浏览记录
ID:34592475
大小:2.25 MB
页数:50页
时间:2019-03-08
《基于微博的个性化搜索系统》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、摘要当今,互联网技术飞速发展,能够随时随地发表和分享自己的即兴感受成为人们新的需求。微博作为一种新型社会媒体形式,受到了广泛的关注。目前在互联网上每天产生数以百万计的微博,给用户快速寻找所需的微博信息带来了挑战。基于微博开发的搜索引擎可以部分解决这一问题。但是,大多数的搜索引擎都仅仅基于内容构建,无法满足不同用户从海量微博中获取个性化信息的需求。因此,如何将个性化需求融入微博搜索是一个亟待研究的课题。针对上述问题,本文通过建立用户模型,将个性化信息引入到微博搜索的过程中,在此基础上,设计实现了一个基于微博平台的个性化搜索系统。本文所进行的研究工作主要涵盖了以下几个方面:首先
2、是对用户模型的构建展开了深入研究。本文在组建用户模型过程中主要研究了四个方面的内容,即数据获取、建模技术、表示方法以及模型更新方式。在个性化技术方面,系统主要通过分析用户原创微博和转发微博来构建用户兴趣模型,对这两种微博进行了统计,选取词频最高的前50个词语作为该用户的兴趣关键词,并在此基础上实现了个性化搜索。然后本文基于Lucene实现了基于微博平台的个性化搜索功能,并对系统平台的注册/登录模块、建立索引模块、兴趣模型构建模块、个性化搜索模块这四个关键部分的具体实现进行了详细分析。此外,还通过提交查询词来对比系统返回的普通搜索结果以及个性化搜索结果,最后分析了本系统的优缺
3、点。综上所述,本文抓住了当前微博平台这个热点话题,并结合信息检索和个性化领域相关的理论和技术,设计了一个基于微博平台的个性化搜索系统。关键词:个性化搜索;微博搜索;向量空间模型;用户兴趣模型;-i-万方数据ABSTRACTToday,therapiddevelopmentofInternettechnology,wheneverandwhereverpeoplecanpublishandsharetheirfeelingsbecomethenewdemand.Micro-blogasanewtypeofsocialmedia,ithasbeenwidespreadconce
4、rn.Currentlythousandsofmicro-blogsareemergedontheInterneteveryday,anditbringschallengestoquicklyfindthedesiredinformationforusers.Thesearchenginebasedonmicro-blogcansolutepartoftheproblem.However,mostsearchenginesarebasedononlythecon-tent,itcannotmeettheneedsofaccessingtopersonalizedinform
5、ationforusersfromthemassofmicro-blogs.Therefore,howtorealizethepersonalizeddemandinthemicro-blogsearchengineisahottopic.thispaperestablishesusermodelandinteg-rateintotheinformationretrievalprocess.Thepaperalsodesignedapersonalizedsearchsystembasedonmicro-blog.Theresearchworkofthispapermain
6、lyincludethefollowingaspects:Thefirstistobuildusermodel.Thispapermainlyaroundtheusermodeldataacquisition,themodelingmethodandrepresentation,modelupdatingmethodsofthe-sefouraspectshascarriedonthekeydiscussionandresearchwork.Inthepersonal-izedtechnology,systemmainlythroughtheanalysisoftheuse
7、roriginalmicro-blogandretweetedmicro-blogtobuilduserinterestmodel,itstatisticsthetheirfrequen-cy,andselectedthetop50wordsastheuserinterestkeywords,andonthisbasistoachievethepersonalizedsearch.Afterthat,thispaperusesLuceneframeworkandsuccessfullyresearchapers-o
此文档下载收益归作者所有