欢迎来到天天文库
浏览记录
ID:54945370
大小:477.24 KB
页数:8页
时间:2020-04-24
《栅格分类方法详细介绍.docx》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、没有进行过分类的地图,很难让人理解其表意。比如,以中共十八大的各省代表人数为例。本届会议各省代表共计1556人,假若为每一个省(港澳台除外)单独设色,会是这样的效果,这样的地图让人不明其意,不知道各个省的代表人数到底几何。常用的分类方法以ArcGIS提供的六种分类方法为例:DefinedInterval、EqualInterval、Quantile、StandardDeviation、NaturalBreaks(Jenks)、GeometryInterval(GeometryInterval是Esri自己开发的一种分
2、类法,资料太少,这个就先不讨论),介绍下各种方法的原理、实现以及用途。1.EqualInterval等距分类。定义一个分类数,比如0~100的数据,分为4类,那么间隔就是25。间隔定了,那就和定义间隔分类的原理一致了。等距分类和上面的定义间隔分类原理简单,易于计算。比较适合用在温度、成绩和百分比等范围、间隔都为人熟知的数据。但是这两种分类法可能会有“空类”(定义间隔也是的),比如0~100的数据,大部分都在0~50中,剩下的几个在90~100。如果你再按10为间隔去分类,那将会有4个空类!下图按等间隔分为4类2.De
3、finedInterval定义间隔分类。定义一个间隔,比如0~100的数据,定义10为间隔,那么10,20…就是断点,分类数由间隔大小决定。用DefinedInterval分类,提供的信息不多,只能看出不同的省份落在了不同的区间而已,而这个区间的大小没有太大的实际意义。3.Quantile等量分类。又叫分位数分类,每一类的数目一样,这样就不会出现空类了。等量分类适合用于线性分布的数据,比如排名数据。但它不考虑数值大小,很可能将两个大小相近的值分到不同的类别中,也可能数据一样的数据,却分在不同的类中。Quantile分
4、类,每一类中的数目是相同的,也就是每一种颜色的省份个数一样,但它忽视了省份之间人数的差异。4.StandardDeviation标准差分类。显然适合正态分布的数据,用于表现与均值相异的程度。但涉及一点点统计知识,普通用户可能不好理解。StandardDeviation分类可以看出黄色的省份人数适中(均值),而绿色就偏少了,红色最多。另外,这种分类法的图例与一般的不一样,原因是显而易见的。5.NaturalBreaks(Jenks)自然断点分类。一般来说,分类的原则就是差不多的放在一起,分成若干类。统计上可以用方差来衡
5、量,通过计算每类的方差,再计算这些方差之和,用方差和的大小来比较分类的好坏。因而需要计算各种分类的方差和,其值最小的就是最优的分类结果(但并不唯一)。这也是自然断点分类法的原理。另外,当你去看数据的分布时,可以比较明显的发现断裂之处(可以参看前文直方图),这些断裂之处和NaturalBreaks方法算出来也是一致的。因而这种分类法很“自然”。那Jenks又是谁?简单介绍下:GeorgeF.Jenks(1916-1996),美国制图学家,生于纽约。41年本科毕业后加入陆军航空队,退伍后进入雪城大学深造,在Richard
6、Harrison指导下学习制图。49年博士毕业后获堪萨斯大学教职,设计并执教制图学课程至退休。Jenks发明的NaturalBreaks分类法是最常用的数据分类法,也是ArcGIS中的默认分类法。NaturalBreaks算法又有两种:(1)Jenks-Caspallalgorithm(1971),是Jenks和Caspall发明的算法。原理就如前所述,实现的时候要将每种分类情况都计算一遍,找到方差和最小的那一种,计算量极大。n个数分成k类,就要从n-1个数中找k-1个组合,这个数目是很惊人的。数据量较大时,如果分类
7、又多,以当时的计算机水平根本不能穷举各种可能性。所以当时计算的得到的自然断点是看“运气”的!当然也有一些经验得来的评价指标。(2)Fisher-Jenksalgorithm(1977),Fisher(1958)发明了一种算法提高计算效率,不需要进行穷举(暂时还没看明白,文献也很少。等我弄明白了,再另写吧)。Jenks将这种方法引入到数据分类中。但后来者几乎只知道Jenks而不知Fisher了,难道是学地理的数学都太差的缘故:P。ArcGIS也是以这个算法为基础改进的,就是说还要更快!开源软件中也有些实现了,后面再说。
8、NaturalBreaks分类可以很好地“物以类聚”,类别之间的差异明显,而类内部的差异是很小的,每一类之间都有一个明显的断裂之处。6.比较与总结从直观上看这份数据用StandardDeviation和NaturalBreaks分类的效果较好,它们两个都考虑了数据分布的统计特征。而Equal(Defined)Interval和Quantile,
此文档下载收益归作者所有