资源描述:
《DEM粗差剔除方法研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
DEM粗差剔除方法研究1引言1.1选题意义数字高程模型(DigitalElevationModel,简称DEM)是以数字的形式按一定结构组织在一起,表示实际地形特征空间分布的模型,也是地形形状大小和起伏的数字描述,由一系列地面点X,Y位置及其相联系的高程Z组成,是各种信息的载体,是地理信息系统(GeographicInformationSystem,GIS)技术中最重要的内容,是空间数据基础设施的重要组成部分,在生产中具有很高的利用价值。首先,它能够反映区域内的地形条件,为各用图部门提供地形基础,其次,用它制作沙盘,具有快速、简便、精确的优点,可用于军事指挥和模型演示;还可以用于农业部门的农田水利规划,水利部门的洪水淹没损失估算及水利建设的土方量计算,交通、建筑等各建设部门的选址、规划,通讯部门信号覆盖范围的规划与计算,地址、勘探部门地形的分析,各旅游景点的规划及土地资源调查;也能用于二维地理空间上连续分布并逐渐变化的各种非高程属性数据的建模与分析上。可以说DEM数据具有广泛的应用潜力。目前,由于地理信息系统(GIS)的普及以及空间数据基础设施的发展和建设,DEM作为数字线化图(DLG)、数字高程模型(DEM)、数字正射影像图(DOM)和数字栅格图(DRG)即“4D”产品之一,己经成为国家空间数据基础设施(NationalSpatialData第17页(共18页)
1Infrastructure,NSDI)的基本内容之一,并被纳入数字化空间数据框架(DGDF)进行规模化生产。今天,DEM已作为一个独立的产品而存在,并越来越广泛地被用来代替传统地图中等高线对地形的描述,成为地理信息系统的核心数据库以及地学分析的基础数据。与其他工业产品一样,DEM产品也必须有质量管理和质量控制。由于影响DEM质量的因素是多种多样的,无论采用哪种途径都不能很好地解决所有的问题。从误差理论的角度分析,可以划分为系统误差、随机误差和粗差。其中,系统误差总是与特定的观测系统联系在一起,它们可能是由于立体像对的不正确定向造成的,也可能是摄影测量生产过程中忽略了棱镜变形而导致。从统计意义上说,系统误差给观测值带来的偏差在空间上并不是一个常数,但当它们己知时,可用一定的函数关系式来表示。随机误差在大小和符号上表现出偶然性,假如存在足够的观测值,随机误差服从下列特征:(1)正负误差发生的概率大致相同;(2)小误差发生的概率高于大误差;(3)大误差很少发生。随机误差既不可以通过反复观测加以剔除,也不能用一定的函数关系式表示。在空间上,它们呈弱相关性,并在整个DEM中服从高斯分布。粗差是由于观测者在操作仪器时的粗心,或读数、记录时的错误造成的,从统计的角度分析,这类观测值与其他观测值并不属于同一分布。与系统误差和随机误差相比较,粗差对DEM数据所反映的空间变化的扭曲更为严重,特别是现代观测数据量大的情形。因此,在现代测量数据处理中如何消除粗差的影响,特别是自动化观测水平高,数据量大的情况下,就显得越来越重要。粗差它的存在会导致DEM及产品的严重失真,甚至完全不能使用。因此,设计一些算法检测并剔除DEM数据中的粗差是完全必要的。因此探测和剔除DEM数据中存在的粗差显得尤为重要。本课题是在对现有的DEM粗差探测法进行分析的基础上,重点分析基于趋势面的探测DEM粗差的方法及粗差的剔除,并证明其可行性。1.2研究现状DEM是地理空间定位的数字数据集合,它最初是美国麻省理工学院Miller教授为高速公路的自动设计于1956年提出来的,随着各种相关技术的发展,特别是计算机技术在测绘方面的应用使得测绘学科逐渐向数字化、实时处理与多用途的方向发展[1]。质量控制是数字高程模型(DigitalElevationModel-DEM)生产的重要环节之一。然而粗差对DEM数据所造成的空间扭曲往往最为严重,有时能导致DEM及其产品严重失真,甚至完全不能使用,因此很有必要研究一些方法对DEM的粗差进行探测和修正。要有效地探测DEM数据中存在的粗差,必须在数据采集后形成的原始DEM数据中进行。原始的DEM数据结构有规则和不规则两类。从实用的角度来看,在规则格网的DEM数据中探测粗差相对简单一些,因而研究成果也相对丰富,如Hannah[2](1981)的基于坡度信息算法,FolicíSimon(1994)的统计参数法,以及Lóper[3](1997)的主成分分析法等等。如果原始DEM为不规则数据,要转成规则格网点,则需经过数学内插的方法处理。在此过程中,原始数据中粗差点会影响到转换后的多个格网点,从而增加格网点粗差检测的难度。本文是在探讨常用的各种算法的基础上进一步描述基于趋势面的DEM粗差探测与剔除方法。2DEM粗差探测与剔除方法研究2.1基于三维可视化的DEM粗差探测与剔除第17页(共18页)
2通过地形表面的三维可视化建模来审查DEM中可疑数据点,从而剔除严重影响数据质量的粗差或者说错误。DEM有着非常适宜于建立3维可视化的特点,采用DEM3维可视化技术,该方法可以交互式的来检查DEM中出现的可疑数据,剔除严重影响DEM数据质量的粗差[4]。一般对于一个特定的研究区域,在三维透视图上可疑点是否表现为粗差非常直观,很容易据此作出正确地判断。实际上,由于DEM有着非常适宜于建立三维可视化的特点,所以可以首先通过目视效果对粗差进行检测。通常粗差的地形很不自然,因此在实际应用中,可以首先通过目视进行粗差的检测这种方法需要高效可靠的构网技术、快速的交互相应效率以及对异常值敏感的视化图形,如线框透视图、晕渲图等常用的可视化图形,在技术层面上,操作的经验和工作态度对结果也会有相当大的影响。三维可视化的前提是要建立数字地面模型,为了保证所分析都基于原始数据,可选的方法是直接利用原始数据建立不规则三角网络模型(Tin)。该方法不利因素在于,一方面需要高效可靠的建模技术以及可视化处理的策略;另一面,它仅适用于较大粗差的判释,对于中小粗差并不敏感。2.2基于高程信息的不规则分布数据粗差检测与剔除呈散乱分布的数据点粗差探测技术在原理上与规则格网比较类似,但由于散乱分布的数据点的分布特征,坡度信息获取比较困难,具体实现上有两点不同:第一,窗口确定,在规则格网上采用3*3局部窗口是适宜的,但不规则分布点的邻域范围要进行指定,一般可采用窗口尺寸或窗口区域的采样点数量两种方式确定。第二,一致性标准确定,规则格网上比较容易获取坡度信息,而不规则分布上获取坡度信息比较困难,因此,由于高程和坡度同是刻画地形曲面连续性的指标,在散乱数据分布的区域上,高程信息取代坡度成为一致性标准。在每一个窗口中,用高程信息计算统计指标以及确定阂值,方法与规则格网类似。2.3检测规则分布数据中粗差的算法2.3.1基于坡度信息的粗差检测第17页(共18页)
3坡度是地表的固有属性,在局部连续空间的渐变模型上,坡度变化也是连的,因此可采用采样点与周围点的坡度变化是否一致来检测是否含有粗差,通以局部3*3窗口对每一采样点进行判断。其基本思想是对每个表面上的点,在坡度上,高程或突变量引起的形状不连续,可能被怀疑有误差,通过坡度上每个点,应用坡度逼近或改变量来计算,考虑坡度变化的相对值,并以这些相对值计算一个统计值为判断该点合法性的闽值,使计算结果更为可靠。如表1所示,P点在高程矩阵中的行列号为(I,J),它的相临8个点1,2,3,4,6,7,8,9的行列号分别为:1点(I+1,J-l),2点(I+1,J),3点(I+,J+1),4点(I,J-l),6点(I,J+1),7点(I-l,J-l),8点(I-1,J),9点(I-l,J+1)。表1P点坡度计算1(I+1,J-1)2(I+1,J)3(I+1,J+1)4(I,J-1)P(I,J)6(I,J+1)7(I-1,J-1)8(I-1,J)9(I-1,J+1)该算法分三步进行,首先以检测点P的8个邻域点分别计算I,J方向的坡度值,然后计算各个方向的坡度变化值DSC,根据每个数据点在同一方向上的两个DSC值相加,其值用于计算均方根差(RMSE),如果坡度变化一致的话,则同一点在同一方向上的两个DSC值和的绝对值将是很小的值(接近0),反之如果坡度变化不一致的话,这个值将比较大。若某一数据点在行列方向上的DSC值都大于闭值(闭值为RMSE的K倍),则可确信它含有粗差。对于K值,不同情况下,可以使用不同的值,如果DSC值分布比较均匀(此时RMSE值比较小),K可以取大一些的值;反之(RMSE值较大),则K值以取小一些的值。对判断含粗差的点进行改正,以保证数据质量的提高[5]。2.3.2基于参数统计的粗差检测假设超限误差只是局部相关的,Felicisimo算法研究的对象是某点高程值,和其邻域点内插出的高程值之,之间的差值民,,如果使用双线性内插而言,只要使用邻域的四个点就够了,在这种情况下,对矩阵第i行,第j列交叉处点高程值可按下式计算[6]:高程估值与DEM中高程值之差为:第17页(共18页)
4如果此过程应用于DEM中所有点,可以得到高程差值的代数均值和标准偏差,假设服从均值为,标准偏差为(均从这个采样中获得)的高斯分布,可以用双尾检验来验证是否属于该分布的集合。通过引进t统计量,,可以看做一个标准化残差,因从模型中获得的数据量很大,故可假设服从分布,对于置信水平ɑ=0.001,统计量的临界值为3.219,由此可进行两个假设的检验,其中零假设为,而被选假设为,任何残差,使的数据点都被怀疑为含有粗差,但事实上,大的值并不能指出粗差,而仅仅是一个警告符号。表23*3窗口计算单元粗差的修正应该紧紧伴随着粗差的探测过程,在DEM的栅格矩阵中,由于不允许空格点的存在,一旦某个粗差被检测就应该加以改正,这里最简单的方法就是用临近点的高程均值来代替可疑点的高程值,需要指出的是任何可疑数据点都不应参与高程估值的计算。上述过程可以迭代进行,其计算方法如表2以3*3窗口为计算单元,每一次迭代中统计量和都会变化,直到没有超过临界值的残差出现。2.3.3基于主成分分析的粗差检测主成分分析是把多个指标化为少数几个综合指标的一种统计方法[7]。在实际的研究中,为了全面分析问题,往往使用众多有关的变量。但是,变量太多不但会增加计算的复杂性,而且也给合理地分析问题和解释问题带来困难。一般来说,虽然每个变量都提供了一定的信息,但其重要性有所不同。实际上,在很多情况下,众多变量间有一定的相关关系,人们希望利用这种相关性对这些变量加以“改造”第17页(共18页)
5,用为数较少的新变量来反映原变量所提供的大部分信息,通过对新变量的分析达到解决问题的目的。主成分分析便是在这种降维的思想下产生的处理高维数据的统计方法。主成分分析的基本方法是通过构造原变量的适当的线性组合,以产生一系列互不相关的新变量,从中选出少数几个新变量并使它们含有尽可能多的原变量带有的信息,从而使得用这几个新变量代替原变量分析问题和解决问题成为可能。当研究的问题确定之后,变量中所含的“信息”的大小通常用该变量的方差来度量。主成分分析法进行DEM粗差的探测包括以下几个步骤:(l)对于给定的大小为n*m的DEM,将其分别划分为列主方向和行主方向度为w的带状区域,实施下列步骤直到满足一定的准则。(2)处理列主方向的带状区域。a.确定可能含有粗差的列;b.在每一列中确定差的位置,从而获取备选粗差数组1。(3)处理行主方向的带状区域。a.确定可能含有粗差的行;b.在每一行中确定差的位置,从而获取备选粗差数组2。(4)将两套备选粗差进行比较。(5)提供计算准则,改正所有的粗差。(6)结束。由于粗差数据影响统计量的计算,因而上述过程需要迭代进行,在每一次代中,都可以得到一组“粗差候选序列”。如果确定为真正的粗差,就对相应数据点加以修正,并从“候选序列”中去除,接着进行下一步迭代过程,并设一定的条件来控制程序的进程。2.4检测不规则分布数据中粗差的算法规则格网DEM具有很多优点,它的数据结构简单,便于存储和处理;但有不足之处,它对地表的描述没有非规则DEM的精确,也无法顾及地形变化特征点和线。除此以外,在实际的生产中,规则格网DEM通常都是由非规则网DEM通过内插而得到的。如果原始DEM为非规则数据,要转成规则格网点在此过程中,原始数据中粗差点会影响到转换后的多个格网点,从而增加格网粗差检测的难度。因此,很有必要讨论和验证基于非规则格DEM的粗差探算法。目前,最典型的基于非规则DEM的粗差探测算法是李志林提出的点方算法[8]。2.4.1基于点方式的算法首先,确定待定点P周围的邻域点范围,然后计算窗口范围内所有点的平高程(或加权平均值)作为P点的估值,最后计算P点高程值与估值的高程差,如果高程差值大于闽值,则认为P点含有误差。(l)邻域点的范围第17页(共18页)
6确定待定点P周围的邻域点范围,可根据以P为中心的窗口指定,窗口的确定有三种方法,一种是定义窗口的尺寸,另一种是定义窗口覆盖区域内高程点的数量,还有一种方法是同时使用上述两种方法来确定窗口的大小,通过计算区域内点的数量和坐标范围确定一平均窗口。(2)代表值的计算在点方式算法中,把待测点邻域点的平均高程作为该点的代表值。有两种方法可计算邻域点的平均高程,一种是简单的计算高程值的算术平均值,另一种是对每一个邻域点赋以不同的权值。如果P的邻域点包含粗差,用简单算术平均值法更加可信,计算速度也比较快。(3)计算闭值假设城是以第i个点为中心的邻域点的算术平均值,耳为从与第i个点的高程值的差值,即:对DEM中所有的点,可以得到一系列的值,计算均值和标准偏差[9]:其中,为由中心点的窗口范围内数据点计算的高程估值,为点的高程测量值。假设服从均值为,标准偏差为的正态分布,则检测粗差的阈值为的倍(为常数)。阈值确定后,对DEM任一数据点,如果,则认为含有粗差。一旦数据点被检测超限,用其估值来代替可疑的高程值,迭代进行,直到没有超过阈值的高程较差出现。2.4.2基于粗差簇群的算法基于点方式的粗差检测算法是针对检测数据中仅存在单个粗差的情况,而事实上DEM中的粗差经常以一种排列紧凑、数据巨大的簇群方式存在—这在自动相关技术获取的数据中经常存在。与点方式算法相同,首先需要定义一以为中心的窗口,将窗口中的第一点从窗口中移去,从窗口中剩余的点计算新的“代表值”即平均值,然后计算并记录这个平均值与移去的数据点的值之差,此过程迭代进行,直到窗口中所有的点都通过检验[10]。假设在窗口中有M个点,那么通过下式可计算M个差值:式中,是窗口所有剩余数据点的平均值,P是窗口中所有数据点的平均值。余下的过程与点方式检测粗差的算法相同,也是M第17页(共18页)
7个值用来计算一个统计值,并使用该统计值生成闽值,如果某一差值超过了这个闽值,则认为这个数据点含有粗差而需要将其进行剔除。2.5基于等高线拓扑关系的粗差检测与剔除众所周知,相邻等高线的高程值之间的关系有且仅有三种:递增、递减或相等,根据这些关系,可对等高线的高程值是否有错作一判断。在等高线地形图上由于存在等高线密集、注记的压盖、断崖地形等情况,常常造成等高线的不连续有时丢失的情形,因此不能仅仅依靠等高距来确定可疑处是否错误。在对所有的可疑处自动检测后,应当对每个可疑处根据等高线的关系由人工进行校验并进行修改,剔除粗差。以上所提出的几种探测方法各有千秋,而我们应在实践中根据自己的DEM的数据源、数据特点、现有的条件选择合适的粗差检测与剔除方法。3基于趋势面的粗差剔除方法研究3.1获取原始DEM数据DEM的数据来源方式有地面测量(利用自动记录的测距经纬仪在野外实测)、现有地图数字化(利用数字化仪对已有地图上的信息如等高线、地形线等进行数字化,目前常用的数字化仪有手扶跟踪数字化仪与扫描数字化仪)、空间传感器(利用GPS等进行数据采集)、数字摄影测量方法(这是DEM数据采集最常用的一种方法)。DEM数据采集的方式有以上几种方法,在实际生产中,究竟要采用哪种方法和生产工艺,主要是取决于DEM的分辨率、精度要求、应用范围的大小以及成本和速度快慢等综合考虑。现把常用的DEM数据采集方法以及各自特性的比较列于表3。表3DEM采集方法及各自特性的比较获取方式DEM的精度速度成本更新程度应用范围地面测量非常高耗时很高很困难小区域范围立体遥感低比较快比较高周期性全球范围内的数据收集GPS比较高很快比较高容易小范围地形图手扶跟踪数字化比较低比较耗时低周期性第17页(共18页)
8国家范围内以及军事上的数据采集,中小比例尺地形图的数据获取地形图屏幕数字化比较低非常快比较低周期性同上激光雷达、干涉雷达非常高很快非常高容易高分辨率、各种范围摄影测量比较高比较快比较高周期性国家范围内的数据收集3.2DEM数据预处理DEM数据预处理是DEM内插之前的准备工作,它是整个数据处理的一部分,一般包括数据格式的转换、坐标系统的变换、数据的编辑、栅格数据的矢量化及数据分块等内容。3.2.1格式转换由于数据采集的硬、软件系统各不相同,因而数据的格式可能也不相同。常用的代码有ASCII码、BCD码及二进制码,每一次记录的各项内容及每项内容的类型位数也可能各不相同,要根据相应的DEM内插软件的要求,将各种数据转换成该软件所要求的数据格式[11]。3.2.2坐标变换若采集的数据一般要转换到地面坐标系。地面坐标系一般采用国家坐标系,也可采用局部坐标系。3.2.3数据编辑将采集的数据用图形方式显示在计算机屏幕上(或展绘在数控测图仪上),作业人员采用图形交互方式进行数据编辑。包括剔除错误的、过密的与重复的点,发现某些需要补测,对断面扫面数据,还要进行扫描的系统误差的纠正。3.2.4栅格数据转换为矢量数据由地图扫描数字化获取的扫描影像是一灰度阵列,首先经过二值化处理,再经过滤波或形态处理(利用数学形态进行各种运算),并进行边缘跟踪,获得等高线上按顺序排列的点坐标,即矢量数据。3.2.5数据分块第17页(共18页)
9由于数据采集方式不同,数据的排列顺序也不同,例如等高线是按各条等高线采集的先后顺序排列的。但在内插DEM时,待定点常常只与其周围的数据点有关,为了能在大量的数据点中迅速地找的所需要的数据点,必须将其进行分块。在某些软件中,需要将数据点划分成计算单元,每个计算单元之间有一定的重叠度,以保证单元的连续性。分块的方法是先将整个区域分成等间隔得格网(通常比DEM格网大),然后将数据点按格网分成不同的类,通常有交换法和链指针法。3.2.6子边界的提取根据离散的数据点内插规则格网DEM,通常是将地面看做是一个光滑的连续曲面,但是地面上存在着各种各样的断裂带,如陡崖、绝壁以及各种人工地物,如路堤等,使地面并不光滑,这就需要将地面分成若干区域,即子区,是每一个子区的表面呈一连续光由特征线滑曲面。这些子区的边界由特征线(如断裂线)与区域的边界线组成。确定每一子区的边界可以采用专门的数据结构或利用图论等多种方法来解决。3.3基于趋势面的粗差检测与剔除方法基于趋势面的粗差探测基础是地形所具有的自相关性,即地形变化符合一定的自然趋势,表现为连续空间的渐变模型,并且这种连续变化可以用一种平滑的数学曲面—趋势面来加以描述。对粗差的检测,可以通过模型误差即实际观测值与趋势面计算值(模型值)之差来判断其是否属于异常数据,因此趋势面分析的一个典型应用就是揭示研究区域中不同于总趋势的最大偏离部分。因此,可以采用趋势面分析找出偏离趋势超过一定闽值的异常数据可疑点。应用趋势面分析进行粗差探测需要注意两点,一是趋势面函数的确定,另一个是阈值问题,即当观测值和计算值相差多大时,该点可被怀疑为粗差点,理论上任何复杂的曲面都可用高阶多项式去逼近,但用高阶多项式的解本身不稳定,同时多项式系数的物理意义也不清楚,可能会导致不符合实际地形起伏的趋势。关于阈值问题,通常按统计方法,假设误差频率呈正态分布,取三倍的中误差为极限值,但毕竟设定闽值的人为因素很大,且现实世界中的变化也可导致不正确的判断,造成粗差点的遗漏或错选。趋势面可有各种不同的形式,在现实生活中,我们通常选择由下式构成的最小二乘趋势面:第17页(共18页)
10据处理区域的形味大小,可以灵活地选择不同阶次的多项式,对大而复杂的区域采用较高阶次。根据统计规律,常用2倍或3倍中误差作为极限误差,即模型误差大于极限误差的观测数据被认为是粗差。趋势面分析技术的特点是能将问题简单化、局部化,能找出大部分的可疑数。3.4实验分析根据提供的10个数据点的坐标和待求点的平面坐标,利用移动二次曲面拟合法,由格网点周围的10个已知点内插出待求格网点的高程,编制相应的程序并进行调试,最后解算出格网点P的高程并提交源程序代码[12]。操作过程:1、首先要导入三个程序矩阵模块"stdafx.h""SMatrix.h""SingleImageResection.h"2、输入已知点数据的坐标3、选择二次曲面作为拟合曲面:列出误差方程:4、组方程,求出6个系数:5、计算出待求点高程。表4已知数据点坐标点号XYZ1102110152109113183105115194103103175108105216105108157115104208118108159116113171011311822编程计算点(110,110)上的高程。运用C++进行DEM内插法的编程程序的代码:#include"stdafx.h"第17页(共18页)
11#include"SMatrix.h"#include"SingleImageResection.h"intmain(intargc,char*argv[]){SMatrixX(10,1);系数矩阵SMatrixY(10,1);系数矩阵SMatrixZ(10,1);系数矩阵X[0][0]=102;//输入已知数据点坐标//X[1][0]=109;//输入已知数据点坐标//X[2][0]=105;//输入已知数据点坐标//X[3][0]=103;//输入已知数据点坐标//X[4][0]=108;//输入已知数据点坐标//X[5][0]=105;//输入已知数据点坐标//X[6][0]=115;//输入已知数据点坐标//X[7][0]=118;//输入已知数据点坐标//X[8][0]=116;//输入已知数据点坐标//X[9][0]=113;//输入已知数据点坐标//Y[0][0]=110;//输入已知数据点坐标//Y[1][0]=113;//输入已知数据点坐标//Y[2][0]=115;//输入已知数据点坐标//Y[3][0]=103;//输入已知数据点坐标//Y[4][0]=105;//输入已知数据点坐标//Y[5][0]=108;//输入已知数据点坐标//Y[6][0]=104;//输入已知数据点坐标//Y[7][0]=108;//输入已知数据点坐标//Y[8][0]=113;//输入已知数据点坐标//Y[9][0]=118;//输入已知数据点坐标//第17页(共18页)
12Z[0][0]=15;//输入已知数据点坐标//Z[1][0]=18;//输入已知数据点坐标//Z[2][0]=19;//输入已知数据点坐标//Z[3][0]=17;//输入已知数据点坐标//Z[4][0]=21;//输入已知数据点坐标//Z[5][0]=15;//输入已知数据点坐标//Z[6][0]=20;//输入已知数据点坐标//Z[7][0]=15;//输入已知数据点坐标//Z[8][0]=17;//输入已知数据点坐标//Z[9][0]=22;//输入已知数据点坐标//for(inti=0;i<10;i++){X[i][0]=X[i][0]-110;Y[i][0]=Y[i][0]-110;}SMatrixM(10,6);for(i=0;i<10;i++){M[i][0]=X[i][0]*X[i][0];M[i][1]=X[i][0]*Y[i][0];M[i][2]=Y[i][0]*Y[i][0];M[i][3]=X[i][0];M[i][4]=Y[i][0];M[i][5]=1;}SMatrixP(10,10);第17页(共18页)
13for(i=0;i<10;i++){P[i][i]=1/(X[i][0]*X[i][0]+Y[i][0]*Y[i][0]);}SMatrixx(6,1);x=(M.T()*P*M).Invert()*M.T()*P*Z;printf("待定点的高程是:%f
14",x[5][0]);return0;}运行结果截图第17页(共18页)
15按上述方法计算模型误差即实际观测值与趋势面计算值(模型值)之差来判断其是否属于异常数据。采用趋势面分析找出偏离趋势超过一定阈值的异常数据可疑点。粗差的修正应该紧紧伴随着粗差的探测过程,在DEM的栅格矩阵中,由于不允许空格点的存在,一旦某个粗差被检测就应该加以改正,这里最简单的方法就是用临近点的高程均值来代替可疑点的高程值,需要指出的是任何可疑数据点都不应参与高程估值的计算。对于不同的数据窗口,分别利用最小二乘法进行移动曲面拟合,得到各个数据窗口内高程残差值列向量,以此为基础计算验后残差值方差式,并以k值作为检测粗差的闭值,由于同一个DEM高程点在不同的拟合区域中计算出不同的残差值,而这些残差值对同一DEM高程点是否为粗差的判断并不一致,即在一个拟合面内认为该点是粗差,而在另一个拟合面内认为是正常点,因此统计每个点在相关的拟合面内被怀疑为粗差的百分比(percent),当percent大于某一限值,则认为点i含有粗差。中位数算法是以残差的中值作为检验统计量来检测粗差,均值算法是以残差的平均值作为检验统计量来检测粗差,虽然它们都是对同一问题的不同解决方式,但中位数算法比均值算法更为简单。由于粗差未知,平差仍从惯常的最小二乘法开始,但在每次平差后,根据其残差和有关其他参数,按所选择的权函数,计算每个观测值在下步迭代平差中的权。如果权函数选择得当,且粗差可定位,则含粗差观测值的权将愈来愈小,直到趋近于零,迭代中止时,相应的残差将直接指出粗差的值,而平差的结果将不受粗差的影响,从而实现粗差的定位剔除。4总结与展望认真总结所做的工作以及在论文撰写中的遇到的困难,认为在DEM的粗差探测中仍然有一些问题有待进一步研究与解决:本文在数据处理方面较为不足,如果能够将VB可视化编程语言和MATLAB工具相结合,充分利用MATLAB的运算功能和VB开发界面方便的特点进行混合编程,即用VB设计界面作为主程序,调用MATLAB子程序,数据处理将会简单、方便。今天,DEM已作为一个独立的产品而存在,并越来越广泛地被用来代替传统地图中等高线对地形的描述,成为地理信息系统的核心数据库以及地学分析的基础数据。目前DEM粗差探测领域中,针对于规则格网DEM算法研究成果较为丰富,这与规则格网形式的DEM具有简单的数据结构和便利的存储方式有很大的关系。相反,由于非规则形式的DEM数据结构相对复杂,这方面的算法设计并不很多,较为实用的是基于点方式的算法。点方式算法是通过中心点的内插值计算检验量,然后进行粗差的判释。无论是规则格网DEM算法还是非规则格网DEM算法来剔除粗差,这些方法从理论上讲都是将粗差归入函数模型来实现粗差的探测。在现代测量数据处理中如何消除粗差的影响,特别是自动化观测水平高,数据量大的情况下,就显得越来越重要。第17页(共18页)
16参考文献[1]柯正谊,何建邦,池天河.数字地面模型[M」.中国科学技术出版社,1993:103-215.[2]李志林,朱庆.数字高程模型[M].武汉:武汉大学出版社,2001:77-83.[3]陈再辉,路晓峰.基于自适应抗差最小二乘的DEM数据粗差剔除[J].海洋测绘,2006,26(6):15-17.[4]希奎,易思蓉,韩春华.基于坡度RMSE与3维可视化的格网DEM粗差检测与剔除[J].测绘通报,2007,6(9):23-25.[5]韩玲.格网DEM中基于坡度信息的粗差检测与剔除方法实验[J].长安大学学报,2003,25(l):74-78.[6]黄宏波,梁鑫,杨晓云,等.基于参数统计的DEM粗差探测算法[J].测绘工程2008,8(2):12-15.[7]王贵满,王东华.DEM的粗差探测与生产质量控制方法[J].测绘与空间地理信息.2011,2(1):1-7.[8]杨晓云,顾利亚,岑敏仪.基于不同大小窗口的移动曲面拟合法探测不规则DEM粗差的一种方法[J].测绘学报,2005,34(2):14-15.[9]杨元喜.自适应抗差最小二乘估计[J].测绘学报,1996,25(3):206-211.[10]黄幼才.数据探测与抗差估计[M].北京:测绘出版社,1990:180-185.[11]徐士良.数值方法与计算机实现[M].北京:清华大学出版社,2006:33-56.[12]傅祖芸,赵梅娜,丁岩,等,译.C语言数值算法程序大全[M].北京:电子工业出版社,1995:98-115.DEMGrossErrorPickingMethodResearchAbstract:Digitalelevationmodel(DEM)asoneof4Dproducts(DEM,DOM-numbersareprojectivelike,DLG-digitallinedrawing,DRG-digitalrastergraph),isakindofdigitaldescriptionandsimulationofthesurfaceoftheearth.Theearthisanimportantpartofspatialdatainfrastructure,itcanbeusedtoestablishaterraindatabaseandallkindsofGIS(geographicinformationsystem),thebasisofquantitativeanalysis,etc.Digitalelevationmodelisfindingwider第17页(共18页)
17andwiderapplication,itcanbeusedtostudyanalysis,thetwo-dimensionalgeographicalspatialcontinuousdistributionandgradualchangeofallkindsofelevationmodelingandanalysisofattributedata.DEMdataaccessusuallyarethegroundmeasurement(usingtheautomaticrecordingofrangingtheodoliteinfieldsurvey),existingdigitalmap(usingthedigitizeronexistinginformationsuchascontoursonmapsandterraindigitalline,atpresentcommonlyuseddigitizerhavemanualtrackingdigitalinstrumentandscandigitizer),spacesensors(usingGPSdataacquisitionetc.),digitalphotogrammetricmethod(whichisoneoftheDEMdataacquisitionisthemostcommonlyusedmethod).Infact,regardlessofthemeasuringmethod,measuringaddressdataalwayscontainallkindsoferror;theerrorcanbedividedintothreekinds,namely,systematicerror,randomerrorandgrosserror.Comparedwithsystematicerror,randomerror,grosserroris,infact,akindoferror,thepossibilitythattheyappearinthemeasurementiscomparedcommonlysmall.Butcomparedwiththeformertwokindsoferror,grosserrorofdigitalelevationmodelwhichreflectsthespatialvariationofdistortionismoreserious,sogrosserrorisoneoftheimportantfactorsaffectingDEMquality.Accordingtostatisticallaw,commonlyusedintwoorthreetime’serrorsasthelimitingerror,themodelerrorisgreaterthanthelimiterrorofobservationdatathatisregardedasagrosserror.GrosserrormainlyappearsintheprocessofDEMproduction,andultimatelyperformanceonelevationZ.Theexistenceofgrosserrorwillcausethedigitalelevationmodel(DEM)spaceseriouslydistorted,sometimescanleadtoseriousdistortionofDEManditsproducts,orevencompletelyunabletouse.SoquestiononDEMgrosserrordiagnosishasincreasinglyarousedpeople'sconcern.DetectingandrejectinggrosserrorinDEMdataisparticularlyimportant.GridDEMhasavarietyofdatatypes:rulesandirregulargrid,contourlines,profile,etc.,DEMgridintheformoftheoriginaldatacanberulesthatmayexistintheformofirregulardistribution,theruleexistsintheformofgriddatahavesomeuniquefeatures,suchaselevationdatacanbestoredintheformofconciseandeconomicinelevationmatrix.Thesefeatureshelptogrosserrordatadetectionalgorithmdesignandbecauseofthat,alsosuitableforthegriddataofgrosserrordetectionalgorithmtodetectirregulardistributionofthedataofgrosserrorisuseless,sofordifferenttypesofdata,itisnecessarytodesigndifferentgrosserrordetectionalgorithmandeliminatingalgorithm.ThistopicisonthebaseoftheexistingDEMgrosserrordetectionmethodandanalysis,toanalysisandargumentthekeymethodofdetectingDEMgrosserrorwhichisbasedontrendsurfaceanalysis.Keywords:Digitalelevationmodel;Grosserrordetection;Grosserrorreject第17页(共18页)