舆情信息的结构分析byZYS

舆情信息的结构分析byZYS

ID:42361025

大小:848.56 KB

页数:24页

时间:2019-09-13

舆情信息的结构分析byZYS_第1页
舆情信息的结构分析byZYS_第2页
舆情信息的结构分析byZYS_第3页
舆情信息的结构分析byZYS_第4页
舆情信息的结构分析byZYS_第5页
资源描述:

《舆情信息的结构分析byZYS》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、C’x’c’q舆情信息的结构分析byZYSPart1舆情网络舆情网络的构建方法0102基于条目之间内容相似度基于主题之间的回复或引用关系将每一个条目对应网络中的一个节点,将条目之间的相似度定义为网络中边的权值。若主题节点A中主题引用了主题节点B中的主题,或者A中给出了指向B中主题的链接,那么就建立一条从节点B指向节点A的有向边,边的权值表示节点A到B的直接关联度。Part2分析基础舆情网络示意图舆情网络分析基础010203节点扩散度整体扩散能力聚集性节点的最大度、节点的平均度和节点的度分布。网络的平均最短

2、路径、网络的直径和最短路径分布。在一个网络中,一个节点的两个邻居彼此也有可能有连接。聚集性用于描述这种可能性的程度(即网络连接的聚集程度)。关键节点0102节点介数节点的接近中心度网络中经过此节点的最短路径数目占所有最短路径数目的比例(反映节点在网络中的连接性)。此节点到其他节点的最短路径的平均值(反映了节点与网络中其他节点的接近程度)。网络中的关键节点是指在舆情传播过程中起到重要作用的节点。例如,网络中大度节点可以被认为是关键节点,这类节点连接了很多其他节点,通过它很容易将信息传播出去。Part3社区结

3、构分析社区结构示意图常见社区发现方法010203迭代二分法(计算机科学)层次聚类法(社会学中分级聚类的思想方法)G-N方法(社会学中分级聚类的思想方法)谱二分法Kernighan-Lin方法(需要事先知道该网络两个社区大小,难以应用)属于凝聚算法属于分裂算法基于节点扩展的社区发现010305节点强度节点i相连所有边权重之和社区大小社区C包含的节点数量(需要大于给定的阈值)不重叠社区的划分社区的粗划分社区的精化连接强度节点i与社区C相连的边的权重之和模块度反映社区划分的效果重叠社区的发现初始社区的发现社区扩

4、展020406特征降维0102特征选择特征提取特征频度、文本频度、特征熵、信息增益和互信息主成分分析(KL变换)潜在语义分析(奇异值分解)随机映射(Johnson-Lindenstrauss引理)关键节点网络中的关键节点是指在舆情传播过程中起到重要作用的节点。舆情内容特征库内容特征集族事件类别事件事件子集舆情文本分类和聚类0102文本分类文本聚类将文档流分到已有的类中。算法思路:计算文档向量Di与事件子集Ej类中心的距离DTij,判断距离Dtij是否小于事件子集Ej的类半径。根据“物以类聚”原理,将本身没

5、有类别的一组的文章或文本信息进行相似性的比较,将比较相似的文章或文本信息归为一个聚类簇。算法思路:先用粗分类算法进行初聚类,然后用凝聚式层次聚类算法进行再聚类Part4话题发现舆论话题发现010203热点分析话题发现话题跟踪对于相同主题的话题,转载次数、帖子回复量和相同主题的贴数可以刻画话题热度。热点词发现(基于词频,只考虑词语的流行性)热点话题聚类(基于热点事件聚类)识别某个已知话题的新闻报道。目标:针对不断增长信息流,追踪某个给定事件主题,发现所有有关该主题的信息Part5情感分析舆情情感分析舆情情感

6、分析就是对人类的各种情感表达进行有效的分析与挖掘,识别出其情感趋向——高兴、伤悲,或得出其观点是“赞同”还是“反对”,甚至情感随时间的演化规律。难度大,应用范围相对较局限。Part6观点挖掘舆情观点挖掘目前研究重点在舆情的准确发现和分类归类方面(Part3、4),对于观点挖掘研究较少Part7系统设计系统设计模块模块名称功能页面预处理模块①对文本进行分词处理,得到单词词性等信息②提取关键词,计算关键词权重文本分类模块①加载分类模型进行文本分类②文本类型标注文本聚类模块①加载文本关键词②关键词向量化③粗分类

7、算法进行初聚类④凝聚式层次聚类算法进行再聚类建立分类模型模块为文档数大于阈值的聚类簇建立分类模型卡方计算聚类所属事件模块卡方计算所得聚类簇所属的已知类别ThankYou

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。