面向微博的热点事件发现与脉络生成研究

面向微博的热点事件发现与脉络生成研究

ID:29144563

大小:2.51 MB

页数:72页

时间:2018-12-17

面向微博的热点事件发现与脉络生成研究_第1页
面向微博的热点事件发现与脉络生成研究_第2页
面向微博的热点事件发现与脉络生成研究_第3页
面向微博的热点事件发现与脉络生成研究_第4页
面向微博的热点事件发现与脉络生成研究_第5页
资源描述:

《面向微博的热点事件发现与脉络生成研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要摘要随着互联网技术及移动终端的快速发展与普及,社交媒体已融入人们的日常生活中,其传播的信息已成为人们获取信息的重要来源。与传统媒体相比,在社交媒体中用户不仅是信息消费者还是信息创造者及传播者,社交媒体为信息的传播、交流及分享提供了新的途径。微博作为一种主要的社交媒体形式,拥有了数以亿计的用户,大量由用户生成的内容使得微博成为发现和分析热点事件的重要数据来源。由于微博平台的开放性,通过该平台发布的信息量是巨大且冗杂的,如果不经过处理,超过负荷的信息量将会导致信息淹没问题。因此,只有有效地从微博数据中发现事件并将其进行整理及总结,才可以使人们快速高效地获得自己需要的信息。基于此

2、,本文以面向微博的热点事件发现与脉络生成作为研究内容,论文的主要工作如下:1)利用微博提供的海量丰富数据、其时空情境及交互特征以有效地发现热点事件,并且基于微博的传播模式、用户交互特性、信息发布的行为等不同维度的特征对事件的类型(虚拟事件、真实事件)进行分类。最后,通过实验验证了事件发现及事件分类方法的有效性。2)通过研究微博在四个不同维度(文本、时间、图像及用户交互)下的关系,建立多层的事件刻画模型,利用多维关系融合的结果生成事件发展脉络。实验结果表明,利用本文提出的事件分割算法可以得到细粒度的事件总结,该总结可反映事件动态的发展变化,此外,本文提出的线索关联性识别算法可以有

3、效地挖掘事件中具有强关系(如因果关系、补充关系及相关关系)的线索集合。3)微博中的多媒体数据丰富却冗杂,需要通过计算文本和图像之间的相关性以挑选出具有代表性的图像集合用于事件总结。然而,文本和图像所在的表达空间并不相同,因此,本文结合跨媒体数据关联的方法提出了跨媒体数据优选算法(CMM)。通过与已有算法进行对比,实验结果表明,利用CMM选择的图像集合在保证数据代表性的同时还提高了数据多样性。关键词:微博,热点事件发现,事件脉络生成,跨媒体数据优选IAbstractAbstractWiththerapiddevelopmentandwidespreaduseofinternett

4、echnologyandmobiledevices,socialmediahasalreadysteppedintopeople’sdailylife,theinformationdisseminatedviasocialmediahasbecomeanimportantsourceforacquiringnews.Comparingwithtraditionalmedia,usersofsocialmediaarenotonlyconsumersbutalsocreatorsandcommunicators,socialmediaprovidesanovelwayforinf

5、ormationpropagation,informationexchangeandinformationsharing.Asamajorformofsocialmedia,microblogholdshundredmillionsofusers,hugeamountsofuser-generatedcontentmakemicroblogbecomeanimportantdatasourcefordetectingandanalyzinghotevents.Duetotheopennessofmicroblogplatform,informationpublishedthro

6、ughtheplatformishugeamountandredundant,excessiveinformationwillleadtoinformationfloodingunlessweprocessitcorrectly.Thus,forthepurposeoffastandefficientinformationacquiring,weshouldeffectivelydetecteventsfrommicroblogdata,organizerelatedinformationandmakesummariesofthem.Basedonthisaim,westudy

7、eventdetectionandstorylinegenerationusingmicroblogdata,themainworkisasfollows:1)Weproposeanefficientapproachforeventdetectionfromhugeamountsofmicroblogdata,andwetrainabinaryclassifierbasedonthreedifferentfeatures,itclassifytheeventintorealorvirtual

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。