欢迎来到天天文库
浏览记录
ID:35078138
大小:6.78 MB
页数:74页
时间:2019-03-17
《微博词共现分析与意见领袖识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、r.一'■VI?■1学校编号10394图书分类号姑学号—2 ̄01 ̄30—610密级*式@巧走巧於乂#:全日制学术学位研究生硕:t学位论文1>‘微博词共现分析与意见领袖识别研究省^-nTermcooccurrenceanalsisandOinioypM-LeaderReconitionoficroblogg1—之天学科专业:计算机应用巧术研究方向:数据巧掘指导教师:郭躬德教授申请学位级别:工学硕壬论文提交日期:2016年3月25日论文评阅人:论文答辩日期
2、:2016年5月25日答辩委员会主席:叶东毅教授V"学位授予单位:福建师范大学学位授予日期:年月曰i‘1.年月.?心:禱參'‘f摘要摘要随着Web2.0时代的快速发展,开放和共享的理念深入人也,使网民对于社交网络平台的使用率得到了极大的提升。在大数据网络中信息的传播速度飞速发展,微博已成为网络舆情的主要来源,微博平台上的公众舆论越来越容易成为社会风气的导向。如何在大量的短文本信息中快速准确地发现舆论热点话题成为舆情监控的首要目标,同时识别和监控意见领袖可W有效地引导舆论走向。本文研究工作主要在于突发话题和意见领袖识别,具体工作
3、内容如下:(1)针对传统词共现方法在微博中检测话题时计算复杂度大、查全率不高、查准率低的情况一,提出了种基于粗糖集原理的改进词共现算法。该算法通过词之间一主题的思想的共现现象表达某,建立词共现矩阵,并通过极大完全子图方法寻找话题簇,最后通过粗糖集理论扩展话题簇来增强语义。实验结果表明该方法能有效地降低传统算法时间复杂度,准确地检测出突发话题的核也词汇。(2)根据情感信息挖掘能更好地反应舆论热点,同时负面情绪更容易导致严重的社会影响。因此利用情感信息能过滤较多无关信息和提高话题检测质量。本文提一种基于词共现和情感元素的突发话题检测算法出了。在情感元素共现的基础上
4、,一建立情感共现矩阵,再通过聚类的方法形成某特定情感的子空间模型。利用情感子空间对话题信息进行划分、,再对不同类别下的微博信息进行核也词汇提取。该方法能过滤掉大部分热点话题无关信息,能反应舆论信息的情感极性,提髙检测信息价值,有利于对舆情信息进行胳控,同时提高了传统算法的效率和精度。(3)意见领袖在信息传播中总是带动舆论的发展,并且意见领袖的信息传播比普通用户更加迅速,同时影响力更大。意见领袖对舆情监控至关重要,基于此因素本文提出了一种特定话题传播网络中的意见领袖检测方法。算法通过转发关系建立了信息传播网络,结合PageRank的影响为评价方法来对特定话题下的
5、意见领袖进行识别,同时将用户的影响力分为自身的权威值和转发用户的支持力。实验结果表明该方法能有效地检测出特定话题下的意见领袖。关键词:微博;词共现;粗趟集;话题检测:情感词子空间;意见领袖识别IAbstractAbstractWith出eraiddevelomentoftheweb2.0theCO打cetofoenne巧andsharinpp,ppgtttttttisdeerooedinheheartsofheeole.Inerneuse巧on化eneworklaformfor化eplypppu
6、seofsocialnetworkhasbeenreatlimroved.Theraiddevelomentofinformationgyppptontrub-proaaispeedinlaredata打ewok化elicoinionQ打化emicroblolatform;spgg,ppgpbecomingmoreandmoresocialtrendoriented.Howtouicklandaccuratelndtheqyyfitoicofublicoinioninalarenumberof
7、shorttextmessaesbecom於therimarpppggpyobectiveofthesuervisionofublicoinionandtheoinionleaderscaneffectiveljppp,pyguide化edirectionofublicoinion.Themainworkofthispaperisfocus
此文档下载收益归作者所有