地理相关微博流自动摘要技术的研究

地理相关微博流自动摘要技术的研究

ID:34086775

大小:2.08 MB

页数:61页

时间:2019-03-03

地理相关微博流自动摘要技术的研究_第1页
地理相关微博流自动摘要技术的研究_第2页
地理相关微博流自动摘要技术的研究_第3页
地理相关微博流自动摘要技术的研究_第4页
地理相关微博流自动摘要技术的研究_第5页
资源描述:

《地理相关微博流自动摘要技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浙江大学硕lj学位论文图H图目录图1.1显性地理相关微博示例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图1.2隐性地理相关微博示例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图3.1系统整体框架图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一15图3.2微博预处理模块流程图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一l7图4.1基于索引过滤的微博与地理位置关联流程图⋯⋯⋯⋯⋯⋯⋯⋯⋯..22图4.2R.Tree索引结构图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一23图4.3倒排索引结构图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

2、一24图5.1微博流自动摘要流程图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..26图5.2微博句子关系图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯35图6一l不同方法关联正确率对比图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯42图6.2不同方法关联速率对比图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯43图6—3不同过滤方法过滤性能比较图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯43图6.4不同方法的ROUGE.Term标准性能比较⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯47图6.5不同方法的ROUGE.1标准性能比较⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一47图6—6

3、不同方法的人工评测结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.48图6.7不同测试标准下历史摘要评测结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一48图6.8vsm与语义相似度处理速度对比⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯49图6.9不同方法处理微博流速度对比⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯49图6一10过滤范围对微博与地理位置关联正确率的影响⋯⋯⋯⋯⋯⋯⋯⋯50图6一ll隐性地理相关微博中各相关性和相似度阈值对关联正确率的影响5l图6.12显性地理相关微博中各相关性和相似度阈值对关联正确率的影响5l图6—13N相关系数)对摘要性能

4、的影⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯52图6.14SMMR阈值对摘要性能的影响⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯52图6一15相似度闽值对摘要性能的影响⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一53图6.16衰退因子对摘要性能的影响⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.54图6.17相似度阈值对摘要性能的影响⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.54浙江大学硕上学位论文表目录表1.1各大平台地理相关信息对比⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯2表6.1手工评测摘要打分机制⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一46IV浙i【大学硕上学位论义

5、第1牵绪论第1章绪论1.1课题背景与研究内容近年来随着移动设备的普及和无线通讯网络技术的进步,地理相关服务(LocationBasedService,LBS)变得非常流行。LBS是指通过移动运营商的无线电通讯网络或外部定位方式,获取移动终端用户的位置消息,在GIS平台的支持下,为用户提供相应服务的一种增值业务。LBS在近几年非常热门,产生了很多应用,比如社交服务类的“街旁”、“切客”,户外旅游类的“路趣”,生活服务类的“口碑网”等。据艾瑞咨询发布的(2010--2011年中国位置签到服务行业研究报告》⋯显示,20

6、10年全年中国国内LBS用户总数达到330万。虽然地理相关的服务和应用前景广阔,但仍有很多问题需要解决。其中一个重要的问题是缺乏地理相关的实时信息。一些点评类的LBS应用虽然有很多用户评论,但是这些信息更新不够频繁,用户通过这些信息只能了解地理位置的总体信息。而生活中,除了地理位置的总体信息,一些实时的信息对用户来说也非常有用。例如,用户通过现有的LBS服务发现某个餐馆口碑很好,然而当他赶到餐馆时却发现餐馆已经没有可以就餐的位置,如果用户在查询时就可以获知餐馆当前已经满座的信息,那么就可以做出更合理的选择。从上面

7、的例子可以看出,某些时候用户需要获取针对某个地理位置的实时信息,而现有的LBS服务并不能很好的满足用户的这个需求,因此需要提供一种包含实时信息的扩展LBS服务使用户更全面的了解地理位置上的信息。最近几年,微博凭着便捷性,互动性在互联网中异军突起。在国外,微博的开创者Twitter到2010年4月为止用户量已经超过l千万,每天产生5千万条微博【21。在国内,微博的代表性网站新浪微博到目前为止注册用户已突破2.5亿【31。和传统的网络内容相比,微博有以下特征:1)实时性。微博可以通过多种方式更新信息,因此用户可以随时

8、随地将所见所感所想第一时间更新到微博上。动车追尾事件,日本地震等事件微浙江人学硕L学位论义第l章绪论博上的信息都要比传统媒体早很多。2)短消息。微博对字数进行了限制,用户只能发表一定长度的文本,因此微博的信息都是短小精悍的,不会像传统的新闻、社区或者博客那样有详细的事件背景介绍和分析。3)信息量大。每时每刻都有用户在微博上分享信息,因此微博上的信息量非常大,这些信息源源不

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。