欢迎来到天天文库
浏览记录
ID:48055696
大小:688.27 KB
页数:16页
时间:2019-10-08
《探索性数据分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、探索性数据分析探索性数据分析是利用ArcGIS提供的一系列图形工具和适用于数据的插值方法,确定插值统计数据属性、探测数据分布、全局和局部异常值(过大值或过小值)、寻求全局的变化趋势、研究空间自相关和理解多种数据集之间相关性。探索性空间数据分析对于深入了解数据,认识研究对象,从而对与其数据相关的问题做出更好的决策。一数据分析工具1.刷光(Brushing)与链接(Linking)刷光指在ArcMap数据视图或某个ESDA工具中选取对象,被选择的对象高亮度显示。链接指在ArcMap数据视图或某个ESDA工具中的选取对
2、象操作。在所有视图中被选取对象均会执行刷光操作。如在下面章节将要叙述的探索性数据分析过程中,当某些ESDA工具(如直方图、Voronoi图、QQplot图以及趋势分析)中执行刷光时,ArcMap数据视图中相应的样点均会被高亮度显示。当在半变异/协方差函数云中刷光时,ArcMap数据视图中相应的样点对及每对之间的连线均被高亮度显示。反之,当样点对在ArcMap数据视图中被选中,在半变异/协方差函数云中相应的点也将高亮度显示。2.直方图直方图指对采样数据按一定的分级方案(等间隔分级、标准差分级)进行分级,统计采样点落
3、入各个级别中的个数或占总采样数的百分比,并通过条带图或柱状图表现出来。直方图可以直观地反映采样数据分布特征、总体规律,可以用来检验数据分布和寻找数据离群值。在ArcGIS中,可以方便的提取采样点数据的直方图,基本步骤为:1)在ArcMap中加载地统计数据点图层。2)单击GeostatisticalAnalyst模块的下拉箭头选择ExploreData并单击Histogram。3)设置相关参数,生成直方图。A.Bars:直方图条带个数,也就是分级数。B.Translation:数据变换方式。None:对原始采样数据
4、的值不作变换,直接生成直方图。Log:首先对原始数据取对数,再生成直方图。Box-Cox:首先对原始数据进行博克斯-考克斯变换(也称幂变换),再生成直方图。C.Layer:当前正在分析的数据图层。D.Attribute:生成直方图的属性字段。从图3.1a和图3.1b的对比分析可看出,该地区GDP原始数据并不服从正态分布,经过对数变换处理,分布具有明显的对数分布特征,并在最右侧有一个明显的离群值。在直方图右上方的窗口中,显示了一些基本统计信息,包括个数(count)、最小值(min)、最大值(max)、平均值(me
5、an)、标准差(std.dev.)、峰度(kurtosis)、偏态(skewness)、11/4分位数(1-stquartile)、中数(median)和3/4分位数(3-rdquartile),通过这些信息可以对数据有个初步的了解。四分位数(1-stquartile):如果将N个数值由小至大排列,第1/4N个数就是第一个四分位数,通常以Q1表示;第2/4N个数就是第二个四分位数(Q2),即中位数;第3/4N个数就是第三个四分位数(Q3)。四分位距即为:Q=Q3-Q1,它将极端的前1/4和后1/4去除,而利用第三
6、个与第一个分位数的差距来表示分散情形,因此避免了极端值的影响。但它需要将数据由小到大排列,且没有利用全部数据。峰度(kurtosis):用于描述数据分布高度的指标,正态分布的峰度等于3。如果数据的峰度大于3,那么该数据的分布就会比正态分布高耸且狭窄,此时数据比正态分布集中于平均数附近;反之,如果峰度小于3,数据的分布就比正态分布平坦且宽阔,此时数据比正态分布分散。偏态(skewness):用于描述数据分布左右对称性的指标,正态分布的偏态等于0。如果数据的直方图向右延伸,即大部分的数据集中于左边,则偏态大于0,称为
7、正偏态或右偏态。如果数据的直方图向左延伸,即大部分的数据集中于右边,则偏态小于0,称为负偏态或左偏态。如图3.1,由原始数据的直方图上可看出,原始数据的分布属于正偏态,经过变换后的数据比正态分布的数据更加集中于平均值附近。(a)原始数据直方图(b)数据变换后的直方图图3.1直方图示意图3.Voronoi图Voronoi地图示由在样点周围形成的一系列多边形组成的。某一样点的Voronoi多边形的生成方法是:多边形内任何位置距这一样点的距离都比该多边形到其他样点的距离要近。Voronoi多边形生成之后,相邻的点就被定
8、义为具有相同连接边的样点。在ArcGIS中生成数据的Voronoi地图的基本步骤如下:1)在ArcMap中加载图层。2)单击GeostatisticalAnalyst模块下的下拉箭头选择ExploreData并单击VoronoiMap。3)设置参数,生成Voronoi图,如图3.2所示。2A.Type:分配和计算多边形值的方法。B.Layer:当前正在分析的数据图层。C.
此文档下载收益归作者所有