基于微博的个性化搜索系统

基于微博的个性化搜索系统

ID:34592475

大小:2.25 MB

页数:50页

时间:2019-03-08

基于微博的个性化搜索系统_第1页
基于微博的个性化搜索系统_第2页
基于微博的个性化搜索系统_第3页
基于微博的个性化搜索系统_第4页
基于微博的个性化搜索系统_第5页
资源描述:

《基于微博的个性化搜索系统》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、摘要当今,互联网技术飞速发展,能够随时随地发表和分享自己的即兴感受成为人们新的需求。微博作为一种新型社会媒体形式,受到了广泛的关注。目前在互联网上每天产生数以百万计的微博,给用户快速寻找所需的微博信息带来了挑战。基于微博开发的搜索引擎可以部分解决这一问题。但是,大多数的搜索引擎都仅仅基于内容构建,无法满足不同用户从海量微博中获取个性化信息的需求。因此,如何将个性化需求融入微博搜索是一个亟待研究的课题。针对上述问题,本文通过建立用户模型,将个性化信息引入到微博搜索的过程中,在此基础上,设计实现了一个基于微博平台的个性化搜索系统。本文所进行的研究工作主要涵盖了以下几个方面:首先

2、是对用户模型的构建展开了深入研究。本文在组建用户模型过程中主要研究了四个方面的内容,即数据获取、建模技术、表示方法以及模型更新方式。在个性化技术方面,系统主要通过分析用户原创微博和转发微博来构建用户兴趣模型,对这两种微博进行了统计,选取词频最高的前50个词语作为该用户的兴趣关键词,并在此基础上实现了个性化搜索。然后本文基于Lucene实现了基于微博平台的个性化搜索功能,并对系统平台的注册/登录模块、建立索引模块、兴趣模型构建模块、个性化搜索模块这四个关键部分的具体实现进行了详细分析。此外,还通过提交查询词来对比系统返回的普通搜索结果以及个性化搜索结果,最后分析了本系统的优缺

3、点。综上所述,本文抓住了当前微博平台这个热点话题,并结合信息检索和个性化领域相关的理论和技术,设计了一个基于微博平台的个性化搜索系统。关键词:个性化搜索;微博搜索;向量空间模型;用户兴趣模型;-i-万方数据ABSTRACTToday,therapiddevelopmentofInternettechnology,wheneverandwhereverpeoplecanpublishandsharetheirfeelingsbecomethenewdemand.Micro-blogasanewtypeofsocialmedia,ithasbeenwidespreadconce

4、rn.Currentlythousandsofmicro-blogsareemergedontheInterneteveryday,anditbringschallengestoquicklyfindthedesiredinformationforusers.Thesearchenginebasedonmicro-blogcansolutepartoftheproblem.However,mostsearchenginesarebasedononlythecon-tent,itcannotmeettheneedsofaccessingtopersonalizedinform

5、ationforusersfromthemassofmicro-blogs.Therefore,howtorealizethepersonalizeddemandinthemicro-blogsearchengineisahottopic.thispaperestablishesusermodelandinteg-rateintotheinformationretrievalprocess.Thepaperalsodesignedapersonalizedsearchsystembasedonmicro-blog.Theresearchworkofthispapermain

6、lyincludethefollowingaspects:Thefirstistobuildusermodel.Thispapermainlyaroundtheusermodeldataacquisition,themodelingmethodandrepresentation,modelupdatingmethodsofthe-sefouraspectshascarriedonthekeydiscussionandresearchwork.Inthepersonal-izedtechnology,systemmainlythroughtheanalysisoftheuse

7、roriginalmicro-blogandretweetedmicro-blogtobuilduserinterestmodel,itstatisticsthetheirfrequen-cy,andselectedthetop50wordsastheuserinterestkeywords,andonthisbasistoachievethepersonalizedsearch.Afterthat,thispaperusesLuceneframeworkandsuccessfullyresearchapers-o

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。