资源描述:
《基于小波变换和混合熵编码的山区格网DEM数据压缩》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第20卷 第1期地理与地理信息科学Vol.20No.12004年1月GeographyandGeo-InformationScienceJanuary2004基于小波变换和混合熵编码的山区格网DEM数据压缩常占强,吴立新(中国矿业大学北京校区3S与沉陷工程研究所,北京100083)摘要:用信息论的观点对山区格网DEM数据进行了分析,发现山区DEM数据具有信息熵高、冗余度低的特点,从而导致了无损压缩方法———熵编码对其进行压缩的压缩比低。为了实现对DEM数据高效、高精度的压缩,笔者提出利用具有线性相位的双正交小波变
2、换以及混合熵编码方法(Huffman编码加游程编码)对山区格网DEM数据进行压缩。实验结果表明,该方法在基本不损失DEM数据精度的情况下,可获得比无损压缩方法高得多的压缩比。关键词:小波变换;信息熵;山区DEM;混合熵编码;压缩比中图分类号:P208文献标识码:A文章编号:1672-0504(2004)01-0024-04息。该方法算法简单快捷,可满足对数据精度要求0 引言不高的虚拟地理景观环境的建立与应用。但因为完数字高程模型(DigitalElevationModel,DEM)全舍去了细节信息,精度损失过大,
3、无法反映地形的②是地理空间定位的数字数据集合,是建立不同层次的细部信息。实验对比的结果说明,数据精度要稍高资源与环境GIS、军事GIS等不可缺少的组成部分。于双线性插值和卷积内插法。4)熵编码压缩方法利规则格网是最常见的DEM形式,其特点是数据用信息统计冗余对数据进行压缩,效果并不理想。排列规则、结构简单、易于理解、最容易用计算机处如用最佳熵编码———Huffman编码只能达到3倍左理,主要缺点是存储量大。全国1∶5万DEM数据成右的压缩比,无法满足对数量庞大、日益膨胀的[1]果数据库已达80GB,1∶1万DEM
4、数据量势必异DEM数据高效压缩的要求。常庞大。目前,成果数据量正以几何级数的速度膨1DEM数据的特点胀,一些专业的数据量达到几百个GB,甚至TB①级。此外,DEM数据的动态属性使其数据总量随1.1 变化不稳定、相关性差时间的延续而不断增加,对DEM数据进行高效、高虽然规则格网DEM与一般的自然数字图像或精度压缩方法的研究势在必行。对格网DEM数据遥感影像的数据结构类似,都为二维矩阵形式,但它压缩主要有4种方法:1)将格网DEM简化为三角网们之间的数据分布特征差别很大:自然数字图像或[2](TIN)方法能有效去除格
5、网DEM数据中的冗余遥感图像的邻接数据(像素)变化较稳定,相关性较数据,可对格网DEM数据进行比较有效的压缩。但强;DEM数据反映自然地形的起伏变化(满足随机[1]是在将格网数据简化为TIN的同时,也失去了格网分形规律),具有变化不稳定、相关性差、比较“破DEM数据的各种优点,而且还需要增加额外的数据碎”等特点。开销对简化TIN的各种拓扑关系进行维护,使压缩1.2 信息熵高②效率受到较大影响。2)双线性插值、卷积内插法是信息熵的概念:设信源符号表为{a1,a2,⋯,an},非常有效的压缩手段,是在ARCPINFO
6、R中内嵌这各符号出现的概率分别为{P(a1),P(a2),⋯,P(an)},两种方法的模块。3)小波变换的多分辨率逼近[4]则该信源的数学模型为:[3,4]法主要思路是将规则格网DEM看成M行N列Xa1,a2,⋯,an=(1)的图像P(x)P(a1),P(a2),⋯,P(an),每个格网的高程值即可视为该像素点的灰n度值。根据小波变换的S.Mallat多分辨率分析法,其中ΣP(ai)=1(2)i=1[4,5]用大尺度上的逼近信息近似代替原始尺度上的信信源的信息熵为: 收稿日期:2003-12-09 基金项目:
7、教育部“高校青年教师奖”专项基金 作者简介:常占强(1964-),男,博士生,主要从事地理信息系统、遥感和矿山沉陷学研究。 ① 吉建培.大型DEM数据库中数据组织的研究[D].武汉:武汉大学,2002. ② 张华军.虚拟地景环境及其应用原形.郑州:解放军测绘学院,1997.第1期 常占强等:基于小波变换和混合熵编码的山区格网DEM数据压缩第25页nH(X)=-ΣP(ai)log2P(ai)(3)2.2 小波变换压缩的基本思想和特点i=1小波变换压缩的基本思想是:信号经小波变换[6,7]信源的信
8、息效率E和冗余度R分别为:后,能量集中在低频(逼近)系数上,并使高频(细节)H(X)E=H(4)部分大量系数的绝对值趋于零,分别对低频(逼近)mR=1-E(5)系数和高频(细节)部分进行量化和编码即可达到压式中:H(X)和Hm分别为信源的实际熵和最大熵值。缩的目的。小波变换具有多尺度空间—频率分辨能笔者将整个图幅的DEM数据视为一信源,每个力以及空域和频域局部的方式,对非