欢迎来到天天文库
浏览记录
ID:52457404
大小:1.76 MB
页数:61页
时间:2020-03-27
《ArcGIS 9 教程_第10章 地统计分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第十章地统计分析地统计分析方法被广泛应用许多领域,已成为空间统计学的一个重要分支。很长时间以来,地统计分析一直没能很好的和GIS分析模型紧密结合在一起,这成为GIS软件一大遗憾。ArcGIS地统计分析模块在地统计学与GIS之间架起了一座桥梁,使得复杂的地统计方法可以在软件中轻易实现,体现了以人为本、可视化发展的趋势。这种结合具有重要的开创性意义,通过测定预测表面的统计误差,GIS应用人员首次能够对预测表面的模型质量进行量化。本章主要通过对地统计分析的概念介绍,逐步引导读者在ARCGIS中如何应用地统计分析解决实际问题。
2、10.1地统计基础10.1.1基本原理地统计(Geostatistics)又称地质统计,是在法国著名统计学家G.Matheron大量理论研究的基础上逐渐形成的一门新的统计学分支。它是以区域化变量为基础,借助变异函数,研究既具有随机性又具有结构性,或空间相关性和依赖性的自然现象的一门科学。凡是与空间数据的结构性和随机性,或空间相关性和依赖性,或空间格局与变异有关的研究,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、波动性时,皆可应用地统计学的理论与方法。地统计学与经典统计学的共同之处在于:它们都是在大量采样的
3、基础上,通过对样本属性值的频率分布或均值、方差关系及其相应规则的分析,确定其空间分布格局与相关关系。但地统计学区别于经典统计学的最大特点即是:地统计学既考虑到样本值的大小,又重视样本空间位置及样本间的距离,弥补了经典统计学忽略空间方位的缺陷。地统计分析理论基础包括前提假设、区域化变量、变异分析和空间估值。1.前提假设(1)随机过程与经典统计学相同的是,地统计学也是在大量样本的基础上,通过分析样本间的规律,探索其分布规律,并进行预测。地统计学认为研究区域中的所有样本值都是随机过程的结果,即所有样本值都不是相互独立的,它们
4、是遵循一定的内在规律的。因此地统计学就是要揭示这种内在规律,并进行预测。(2)正态分布在统计学分析中,假设大量样本是服从正态分布的,地统计学也不例外。在获得数据后首先应对数据进行分析,若不符合正态分布的假设,应对数据进行变换,转为符合正态1分布的形式,并尽量选取可逆的变换形式。(3)平稳性对于统计学而言,重复的观点是其理论基础。统计学认为,从大量重复的观察中可以进行预测和估计,并可以了解估计的变化性和不确定性。对于大部分的空间数据而言,平稳性的假设是合理的。这其中包括两种平稳性:一是均值平稳,即假设均值是不变的并且与位
5、置无关;另一类是与协方差函数有关的二阶平稳和与半变异函数有关的内蕴平稳。二阶平稳是假设具有相同的距离和方向的任意两点的协方差是相同的,协方差只与这两点的值相关而与它们的位置无关。内蕴平稳假设是指具有相同距离和方向的任意两点的方差(即变异函数)是相同的。二阶平稳和内蕴平稳都是为了获得基本重复规律而作的基本假设,通过协方差函数和变异函数可以进行预测和估计预测结果的不确定性。2.区域化变量当一个变量呈现一定的空间分布时,称之为区域化变量,它反映了区域内的某种特征或现象。区域化变量与一般的随机变量不同之处在于,一般的随机变量取
6、值符合一定的概率分布,而区域化变量根据区域内位置的不同而取不同的值。而当区域化变量在区域内确定位置取值时,表现为一般的随机变量,也就是说,它是与位置有关的随机变量。在实际分析中,常采用抽样的方式获得区域化变量在某个区域内的值,即此时区域化变量表现为空间点函数:Z(x)=Z(x,x,x)(10.1)uvw根据其定义,区域化变量具有两个显著特征:即随机性和结构性。首先,区域化变量是一个随机变量,它具有局部的、随机的、异常的特征;其次,区域化变量具有一定的结构特点,即变量在点x与偏离空间距离为h的点x+h处的值Z(x)和Z(
7、x+h)具有某种程度的相似性,即自相关性,这种自相关性的程度依赖于两点间的距离h及变量特征。除此之外,区域化变量还具有空间局限性(即这种结构性表现为一定范围内)、不同程度的连续性和不同程度的各向异性(即各个方向表现出的自相关性有所区别)等特征。3.变异分析(1)协方差函数协方差又称半方差,表示两随机变量之间的差异。在概率论中,随机变量X与Y的协方差定义为:Cov(X,Y)=E[(X−E(X))(Y−E(Y)](10.2)借鉴上式,地统计学中的协方差函数可表示为:N(h)1C(h)=∑[Z(xi)−Z(xi)][Z(xi
8、+h)−Z(xi+h)](10.3)N(h)i=1其中,Z(x)为区域化随机变量,并满足二阶平稳假设,即随机变量Z(x)的空间分布规律不因位移而改变;h为两样本点空间分隔距离;Z(x)为Z(x)在空间点x处的样本值;ii2Z(x+h)是Z(x)在x处距离偏离h的样本值[i=1,2,…,N(h)];N(h)是分隔距离为h时ii的样本
此文档下载收益归作者所有