社会网络舆情信息研究和可视化

社会网络舆情信息研究和可视化

ID:32941417

大小:58.45 KB

页数:7页

时间:2019-02-17

社会网络舆情信息研究和可视化_第1页
社会网络舆情信息研究和可视化_第2页
社会网络舆情信息研究和可视化_第3页
社会网络舆情信息研究和可视化_第4页
社会网络舆情信息研究和可视化_第5页
资源描述:

《社会网络舆情信息研究和可视化》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、社会网络舆情信息研究和可视化摘要:社交网络作为一个虚拟社会,人们在网络上的行为与现实生活的行为具有共性。当前,分析网络用户的行为规律,例如人们在网络上的个体流行程度和活跃程度等已经成为了研究热点。但是,目前的研究还局限于定性或者半定量的统计性质分析,缺少理论以及背后机理分析。本文主要介绍了网络数据的抓取,实现数据的可视化以及舆情信息的分析三个方面。关键词:社交网络;据抓取;可视化;舆情信息分析中图分类号:TP393.091前言社交网络作为一个虚拟社会,人们在网络上的行为与现实生活的行为具有共性。同时,社交网络作

2、为复杂网络的一种,研究其网络结构性质同样具有重要的意义。但是,目前的研究还局限于定性或者半定量的统计性质分析,缺少理论以及背后机理分析。目前公安舆情监控主要集中在各大新闻、论坛、贴吧、问答、电子报、视频、博客中等,但是忽视了与社交网络信息传播规律的结合。社交网络本身比较抽象,对于节点数比较多的网络,在计算机中通常是以各种数据格式进行存储,很难以直观的方式展现,更难以动态的观察网络的发展变化过程。如果仅用数据表格或文字的形式来表示网络,理解起来非常困难,导致网络所包含的有价值的信息不能直观的体现出来。2背景及现状

3、2.1社会性网络研究社会性网络服务(socialnetworkservice,SNS)是Web2.0体系下的一个技术应用架构。SNS通过网络聊天、博客、播客和社区共享等途径,实现个体社交圈的逐步扩大,最终形成一个联结"熟人的熟人”的大型网络社交圈,充分反映出人类社会的六度分离特征。在国外,首屈一指的SNS网络Facebook拥有超过千万的用户,成为全世界最大的社交网站。社交网络作为一个虚拟社会,人在SNS网络上的行为与现实生活的行为具有共性。分析网络用户的行为规律,例如人在SNS网络上的个体流行程度和活跃程度等

4、已经成为了研究热点。2.2可视化研究计算机最早多用于科学计算和数据处理,但由于技术的限制,对数据主要只能进行批量处理,而不能进行交互处理或对计算过程进行有效的控制,对相关数据的显示与处理过程的表示存在一定局限性,一些海量数据集或复杂过程就难于直观地表达出来。随着科学研究领域的不断扩大,在超级计算机、飞行器、气象、医学和勘探等领域产生了大量的数据,一种能处理和解释这些海量数据的技术,科学计算可视化就此产生。科学计算可视化(visualizationinscientifieeo,nputing,简称VISC)是指应

5、用计算机图形学和图像处理技术,将科学计算过程中产生的数据或产生的结果数据,转换为人们容易理解的图形图像形式,并在屏幕上显示出来。科学计算可视化把科学计算过程中的数据或结果转变成人的视觉可以感受到的计算机图像,这些图像可以将大量的信息有机地组织在一起,形象地显示数据所表示的内容及其相互间的关系,从而可以使许多抽象的、难于理解的方法、原理和规律的表示变得简单直观,许多繁冗枯燥的数据可以一种生动明了的形式呈现出来。数据可视化技术主要包括五种,分别是:标准2D/3D显示技术、基于几何的技术、基于图标的技术、基于层次的可

6、视化技术和基于层次的可视化技术,其中标准2D/3D显示技术就是将数据画成折线图、条形图、柱状图、饼图、散点图、分位数图、回归曲线图。基于几何的技术是几何画法或者几何投影的方式表示数据集中的数据用线或曲线来表示数据各维变量的联系。包括地形图、散点图、映射追踪图和平行坐标等方法。其中聚类结果的平行坐标如图1所示。基于图标技术的基本思想是用一个简单图标的各个部分来表示数据各维的属性,基于图标可视化方法包括枝形图、颜色图标和形状编码等等。该技术适用于维属性值在二维空间内具有良好展开属性的数据集。基于层次的可视化技术是将

7、高维数据空间划分为若干个子空间,这些子空间仍然以层次结构的方式组织并以图形表示。基于层次的可视化方法多利用树形结构,可以直接应用于具有层次结构的数据,也可以对数据变量进行层次划分,在不同层次上具有不同属性值。基于层次的可视化技术主要有维、树图、维嵌套等等。面向像素的技术是将每个数据项的数值对应一个带颜色的屏幕像素,使用不同的窗口分别表示不同的数据属性。这种技术主要利用圆周分割模型、递归模型、螺旋模型等方法分布数据,其目的是在屏幕窗口上显示尽量多的数据。2.3社会性网络舆情研究舆情的分析可以归为两类,静态发现和动

8、态发现。静态发现是指比较传统的方法,例如问卷调查,电话调研等,因为时间和空间的限制,这种方式已经逐渐被动态发现所取代,动态发现是指对电子文本数据的自动分析,通过收集报纸,杂志,网络文本等数据,然后对其进行分析发现舆情。通常,分析的手段主要包括文本的分类和聚类,分类是指将文本分到指定的类中,如将一篇报道西藏问题的文本分到政治这个类别中;聚类是指按相似性将文本以组的形式聚在一起,组内的成员

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。