欢迎来到天天文库
浏览记录
ID:36416537
大小:3.26 MB
页数:32页
时间:2019-05-09
《数据可视化技术分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、数据可视化技术分析学生姓名:王修岩目录ContentsC01研究背景及意义02数据可视化的主要方法03数据挖掘的可视化04大数据环境下数据可视化05结论问题与挑战课题背景及意义当前,我们的世界已经迈入大数据(bigdata)时代。截至2012年,全世界每天产生2.5EB的数据。然而,无论数据有多大,最终,信息必须流经一个最紧的瓶颈,人脑吸收和处理新信息的能力所能达到的速度。人类视觉系统不足以满足人类以数据本身的形式来工作的要求,因此迫切需要提供可视化的工具。所谓数据可视化,是对大型数据库或数据仓库中的数据的可视化,它是可视化技术在非空间数据领
2、域的应用,使人们不再局限于通过关系数据表来观察和分析数据信息,还能以更直观的方法看到数据及其结构关系。数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。研究背景及意义返回一幅图胜过千言万语.人类从外界获得的信息约有80%以上来自于视觉系统,当大数据以直观的可视化的图形形式展示在分析者面前时,分析者往往能够一眼洞悉数据背后隐藏的信息并转化知识以及智慧.如图所示是互联网星际图,将196个国家的35万
3、个网站数据整合起来,并根据200多万个网站链接将这些星球通过关系链联系起来,每一个星球的大小根据其网站流量来决定,而星球之间的距离远近则根据链接出现的频率、强度和用户跳转时创建的链接.我们可以立即看出,Facebook以及Google是流量最大的的网站。研究背景及意义返回可视化的主要方法人类的认知系统可以识别空间三维物体,对于抽象的无线识别很困难。目前对于构成可视化的方法中主要的方法,有以下几个方面。空间三维图形:通过图形的密度颜色分布,大致能够了解数据的分布,数据之间的相似性和数据之间的关系。颜色图:分为彩色图和灰度图。彩色图的每一种颜色,
4、对应着不用的属性维,灰度图可以利用颜色的深浅来标记数据量的属性值的大小,颜色越深数值越大。亮度:对于特定的区域,用不同的亮度来辅助人眼对视点的观察。数学的方法:利用数学中统计的方法,先对数据关系进行分析,得到数据的大体分布信息,然后再结合其他可视化方法来进行细节数据分析。或者利用数学统计方法对数据中的关系进行映射,映射成为图形图像关系来帮助分析。返回可视化的主要方法目前主要的多维数据可视化技术1ScatterplotMatrix(散点图矩阵)Scatterplot是显示多个数据维中任意两个数据维之间的依赖关系的矩阵图,分别把多维数据中的每一个
5、维数对称地标注在横轴和纵轴上,把它们在数据集中每一对出现的频度作为关系依赖的评价,这样每两维的关系被显示在这个平面网格图中(图3)。在Scatterplot的matrixn维矩阵中,scatterplots会产生n*(n-1)/2对维之间的关系。返回可视化的主要方法2几何图技术1)星型图:每个星型标记的构造方法如下:任选空间的某一点作为一个星型标记的中心点,由中心点作出n条线段来代表n个数据维,这n个线段把平面平均分成n份。一般地,每一个线段长度代表一个数据维的值的大小。把一个星型标记线段的终点全部用直线连接起来,就构成了一个星型图(图4)。
6、每一个星型图都代表数据库中一条记录,这样一组数据就用一组星型来代表。2)雷达图:类似于星型图的构造方法。3)Andrew’sGurves:对于多维数据的数据点x=(x1,x2,*,*,*,*,xn),被周期函数Fx(t)=X1/sqrt(2)+X2sin(t)+X3cot+X4Sin(2t)+cos(2t)作用于一个多维数据点或者(一个多维)数据集合,被显示成为一组曲线,曲线的分布情况反映了数据的性质。4)shapecoding技术:主要思想是每一个数据点位于一个已经分解成n个细胞表格的长方形中,而且每一个细胞表格的颜色由每一维来控制。5)G
7、rand-tour技术:从不同的视角看待多维数据,投影数据在可能的d-planes通过泛化的旋转。返回可视化的主要方法3平行坐标技术平行坐标技术是最早提出的以二维形式表示n维空间的数据可视化技术之一。它的基本思想是将n维数据空间用n条等距离的平行轴映射到二维平面上,每条轴线都对应于一个属性维。坐标轴的取值范围,从对应数据维属性的最小值到最大值均匀分布(名词性属性依次在数据维上标出即可),这样数据库中的每一条数据记录都可以转换成为图形的形式,都可以用一条折线表示在n条平行轴上(图6)。返回传统的数据挖掘过程如图1所示,是以机器为中心的;而新的吸
8、纳了可视化技术的数据挖掘过程是以人为中心的,如图2所示。以人为中心的数据挖掘过程,将数据挖掘与可视化技术完美结合,提高了数据挖掘过程的灵活性、有效性、与用户的交互性
此文档下载收益归作者所有