数据可视化技术分析(成品)

数据可视化技术分析(成品)

ID:21899012

大小:9.90 MB

页数:40页

时间:2018-10-21

数据可视化技术分析(成品)_第1页
数据可视化技术分析(成品)_第2页
数据可视化技术分析(成品)_第3页
数据可视化技术分析(成品)_第4页
数据可视化技术分析(成品)_第5页
资源描述:

《数据可视化技术分析(成品)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据可视化技术分析目录01研究背景及意义02数据可视化的主要方法03数据挖掘的可视化04大数据环境下数据可视化05数据可视化实现技术06问题与挑战01研究背景及意义课题背景及意义世界已经迈入大数据时代,全世界每天产生2.5EB的数据。由于呈指数增长的数据量,人类视觉系统不足以满足人类以数据本身的形式来工作的要求,因此迫切需要提供可视化的工具。所谓数据可视化,是对大型数据库或数据仓库中的数据的可视化,它是可视化技术在非空间数据领域的应用,不再局限于通过关系数据表来观察和分析数据信息,而是以更直观的方法看到数据及其结构关系。数据可视化技术的基本思想是将每一个数据项作为单个图元元素表示,大量的数据

2、集构成数据图像,同时将数据各个属性值以多维的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。数据可视化的定义实例:涉及到计算机图形学、图像处理、计算机视觉、计算机辅助设计等多个领域,成为研究数据表示、数据处理、决策分析等一系列问题的综合技术广义:指一切能够把抽象、枯燥或难以理解的内容,包括看似毫无意义的数据、信息、知识等等以一种容易理解的视觉方式展示出来的技术;狭义:利用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行各种交互处理的理论、方法和技术过程:是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过

3、程数据可视化发展历程可视化思想的起源(15世纪—17世纪)数据可视化的孕育时期(18世纪)数据图形的出现(19世纪前半叶)第一个黄金时期(19世纪中、末期)低潮期(20世纪前期)新的黄金时期(20世纪中末期至今)数据可视化早期探索时期没有实质性进展依附计算机技术的发展焕发新的生命数据可视化初步发展数据统计得到重视图形图表广泛应用数据空间由n维属性和m个元素组成的数据集所构成的多维信息空间数据开发利用一定的算法和工具对数据进行定量的推演和计算数据分析指对多维数据进行切片、块、旋转等动作剖析数据,从而能多角度多侧面观察数据将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时

4、将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。基本思想数据可视化的几个基本概念一幅图胜过千言万语.人类从外界获得的信息约有80%以上来自于视觉系统,当大数据以直观的可视化的图形形式展示在分析者面前时,分析者往往能够一眼洞悉数据背后隐藏的信息并转化知识以及智慧如图所示是互联网星际图,将196个国家的35万个网站数据整合起来,并根据200多万个网站链接将这些星球通过关系链联系起来,每一个星球的大小根据其网站流量来决定,而星球之间的距离远近则根据链接出现的频率、强度和用户跳转时创建的链接.我们可以立即看出,Facebook以及Google是流量

5、最大的的网站。研究背景及意义02数据可视化的主要方法空间三维图形01通过图形的密度颜色分布,大致能够了解数据的分布,数据之间的相似性和数据之间的关系颜色图02分为彩色图和灰度图。彩色图的每一种颜色,对应着不用的属性维,灰度图可以利用颜色的深浅来标记数据量的属性值的大小,颜色越深数值越大。数学的方法03利用数学中统计的方法,先对数据关系进行分析,得到数据的大体分布信息,然后再结合其他可视化方法来进行细节数据分析。或者利用数学统计方法对数据中的关系进行映射,映射成为图形图像关系来帮助分析。亮度04对于特定的区域,用不同的亮度来辅助人眼对视点的观察。人类的认知系统可以识别空间三维物体,对于抽象的无

6、线识别很困难。目前对于构成可视化的方法中主要的方法,有以下几个方面:Scatterplot是显示多个数据维中任意两个数据维之间的依赖关系的矩阵图,分别把多维数据中的每一个维数对称地标注在横轴和纵轴上,把它们在数据集中每一对出现的频度作为关系依赖的评价,这样每两维的关系被显示在这个平面网格图中(图3)。在Scatterplot的matrixn维矩阵中,scatterplots会产生n*(n-1)/2对维之间的关系。目前主要的多维数据可视化技术——ScatterplotMatrix(散点图矩阵)1.星型图:每个星型标记的构造方法如下:任选空间的某一点作为一个星型标记的中心点,由中心点作出n条线段

7、来代表n个数据维,这n个线段把平面平均分成n份。一般地,每一个线段长度代表一个数据维的值的大小。把一个星型标记线段的终点全部用直线连接起来,就构成了一个星型图(图4)。每一个星型图都代表数据库中一条记录,这样一组数据就用一组星型来代表。2.雷达图:类似于星型图的构造方法。3.Andrew’sGurves:对于多维数据的数据点x=(x1,x2,*,*,*,*,xn),被周期函数Fx(t)=X1/sqrt(2)+

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。