基于微博的位置推测技术-研究

基于微博的位置推测技术-研究

ID:34157834

大小:3.73 MB

页数:71页

时间:2019-03-03

基于微博的位置推测技术-研究_第1页
基于微博的位置推测技术-研究_第2页
基于微博的位置推测技术-研究_第3页
基于微博的位置推测技术-研究_第4页
基于微博的位置推测技术-研究_第5页
资源描述:

《基于微博的位置推测技术-研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、杭州电子科技大学硕士学位论文摘要微博已经成为人们快速分享和传播信息的平台,其特点是全民都可以在微博上随时随地发布和分享信息。为了实现基于位置的服务,如何从分散和多样化的信息中推测用户的位置成为了微博时代面临的一个难点和热点问题。结合国内外现有的位置推测技术,以已知的位置知识为前提,针对如何提高不同地理粒度下位置推测的准确率和解决位置信息的稀疏性问题,本文对基于微博的位置推测技术进行了研究。首先,为了实现在城区和街道级别的粒度下位置推测,提出了一种基于语言模型的微博位置推测方法。充分利用微博中城区和街道粒度下地理信息的特征,通过改进的本地词汇提取算法来构建基于语言模型的微博位置推测方法。实验

2、结果表明,该方法可以实现一元语言模型和二元语言模型下的城区级别位置推测,f-measure分别为0.32和0.34。同时可以实现城区和街道粒度下位置推测,且召回率分别达到了24.9%和16.36%;同时实验结果也表明现有微博位置推测技术的准确率和召回率还有待提高,尤其是需要解决位置信息稀疏性的问题。其次,针对在微博位置信息稀疏性情况下位置推测精度不高的问题,提出了一种基于微博内容的用户位置的推测方法。先从用户的微博内容中提取与地理相关的本地词汇,并计算不同地区本地词汇的权重;然后凭借分词后的微博内容与本地词汇的匹配程度来对用户的位置进行推测。实验结果表明,基于微博内容的位置推测方法在省份级

3、别和城市级别上的准确率分别达到了68.49%和66.52%,优于已有的基于基准算法、地名词典和TEDAS的位置推测方法。最后,为了进一步提高位置推测精度,提出了一种基于微博内容和互粉好友的用户位置推测方法。该方法通过将基于微博内容位置推测和基于互粉好友位置两种推测方法相结合来提高位置推测位置的精度。实验结果表明,本方法的推测位置准确率优于基于微博内容、互粉好友、基准算法、地名词典和TEDAS的位置推测方法;在微博位置信息稀疏的情况下省份级别位置推测精度达到81.39%,城市级别位置推测精度达到78.85%。关键词:位置推测,微博,本地词汇,语言模型I杭州电子科技大学硕士学位论文ABSTRA

4、CTMicrobloghasbecometheinformationplatformforpeopletoshareanddisseminateimmediately,whichfeaturesiseveryonecanpublishandshareinformationanytimeandanywhere.Intheeraofinformationexplosion,aheatissueisraised:howtoinferringuser’slocationfromscatteredanddiversetweets.Inordertoimprovethegranularityofdif

5、ferentgeographicallocationinferenceaccuracyandsolvethepositioninformationsparsity,onthebasisoftheacquiredlocation-relatedinformationcombiningwiththedomesticandforeignexistinglocationinferencetechnology,thispaperstudiedthelocationinferencetechniquesbasedonmicroblogplatform.Firstly,toachievelocation

6、inferenceindistrictlevelandstreetlevel,locationinferencemethodbasedonlanguagemodelispresented.Throughtheanalysisofgeographicinformationfeaturesonmicroblogplatform,modifiedthelocalwordmethodtogetalocationlanguagebasedmodel.Districtlevelandstreetlevelexperimentswerecarriedoutrespectively.Theexperime

7、ntalresultsshowthatunderunigramandbigramlanguagemodelthef-measureis0.32and0.34.Therecallrateofdistrictlevelandstreetlevelis24.9%and16.36%.Alsoitindicatesthatthelocationinferenceaccuracyandrecallrateneedtobeimprov

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。