Chorochromatic Maps,Choropleth Maps,Cartogram Map

前段时间因为毕业论文,睡觉都没睡好,更顾不上更新博客。最近稍有闲暇,便将之间之前几篇写了一半未发布的博客一一完成。

目前我的研究内容有一大部分集中于地理空间数据的可视化。因为地理空间是如此的重要,以至于人类最早的可视化实践就是地图制作。托勒密认为地理学就是“以线画形式描绘地球上所有迄今已知的部分及其附属的东西”。千百年来,围绕地图的制作,产生了测绘学、制图学(cartography)等重要学科。在过去30年中发展起来的地理信息科学将地图理解为包含点、线和面积的空间模型。制图的流程是:

  1. 确定信息要素的特征和确定使用哪种视觉变量表达:找到用于表达的已选择所有数据元素或类别的共同点,然后这个共同点可以用来制作标题;
  2. 确定数据变量或者要素之间属性的多样化或差异,并描述它们的特征:不仅要确定数据的性质,还要确定它们的长度和范围,这样才能找到合适的图元去显示;
  3. 确定描述信息的层次结构:即确定哪些方面最重要,哪些方面最次要,以及结余何种顺序之间的数据描述类型。

按照以上的标准制图流程,对图形视觉变量进行特定组合的结果称之为地图类型。Intelligent Systems in Cartography 一书中总结了超过10种常见专题地图类型,如点值地图(point diagram maps,dot mapping method),线地图( linear diagram maps, cartographic arrowhead methods),质底图( chorochromatic mosaic maps),等值线图( isoline maps), 等值区域图(classification ratio method,choropleth maps),符号地图(nominal point symbol maps), 统计地图(statistical maps, areal diagram methods )等。就像计算机与软件设计专业的23种设计模式一样,这些专题地图类型,也是地理信息系统、测绘学等专业必学的内容。本人计划用数篇博客简介这些标准地图类型。本人无意无意班门弄斧,只是为未来工作做些积累。

1)质底图(chorochromatic maps ,也称mosaic maps,镶嵌图)

气候和植物抗寒区分布质底图,此图例摘自wiki.gis.com

术语chrochromatic来自希腊语“区域”(choros)和“颜色”(chroma)。这个方法使用不同的颜色描述区域内的定名数值(指定性的分类数据)。在黑白印刷的时代,也使用图案作为视觉通道。如例图所示,chorochromatic maps 可以很容易地表示不同地区的植物类型分布。这种制图法的优点是简单易用,易于理解。缺点是:过于小的区域会受到周围区域颜色的影响以至于难以分辨。另外,当呈现的是与面积无关的数据时,读者的心智图像 很大程度上会受到 面积的影响。例如用不同颜色显示人口密度,当有两个面积差不多的不同颜色区域出现时,非专业读者会认为两个地区人口差不多。因此这这种情况下必须用其他图表辅助。

chorochromatic maps (质底图)和choropleth map (等值区域图)在外观上极为类似,所以这里有必要描述一下二者的区别。首要的区别在于上色区域的形成方式。等值区域图的区域由预先定义的边界(通常是行政边界)组成,而质底图由数据分布定义。例如图例中植物抗寒区的变化,不存在政治边界;第二个区别在于其表示的数据类型。等值区域图更多使用的是标称数据(定量数据),而质底图使用的是类名数据(定性数据)。这是一个关键区别。这也是为什么质底图在选择上色方法时,通常不需要考虑颜色过渡的意义。

2)等值区域图 (choropleth maps)

这是应用的最为广泛的主题地图类型。使用不同的颜色、饱和度或者灰度层级,描述每个区域中的离散值(通常是定量的数值或比率)。与质底图类似,使用等值区域图时,也要注意读者心智图像受面积和颜色的影响。

一个choropleth map的例子,反映了捷克共和国2010年各省份放春假的情况(此图例摘自:Dobesova, Zdena Brus, Jan,Intelligent systems in cartography,INTECH Open Access Publisher 2012)

在欧洲的留学生可能有这种经验:经常会发生A放假在家happy闹得太欢,结果影响了还要上班的B的休息。这其中的一个原因是,欧洲国家不同地区的放假情况是各行政区区自己定义的。上图是一个chorochromatic map的例子,反映了捷克共和国2010年各省份放春假的情况。但是,由于春假时间安排并不是一个按大小排序的定量数据,因此上图中用颜色坡度表示数据是错误的,因为从浅黄到深棕的颜色坡度会给人以值域按顺序变化的暗示。相反,下图中给出了正确的使用方式。

除了以上问题外,等值区域图还要考虑的问题是,如何对定量数据进行分级,从而选定有限个数的饱和度或者灰度层级 来有效地传输信息。这里存在一对矛盾的标准:其一是,图形通过分级将得到简化,其中存在的趋势或者规律将能够更好地可视化表达;其二是,如果级内差异最小化而级间差异最大化,那么由分级模型得到的分级界线将于实际保持一致。但显然,以上两个标准不能同时得到满足。故而,存在一些特异性的表达方式:例如,未分级的等值区域图(tobler,1973),根据实际分布调整分级界线的分区密度图(dasymetric map),还有使用小尺寸网格单元,以弱化区域内同质性的错误提示的网格等值区域图,以及按照所比较的数据将区域按比例变形的变形地图(Cartogram map)。

此图中,上面的小图例是choropleth map,下面的小图例是dasymetric map分区密度图, 它们都表示了旧金山2000年的人口。图例摘自https://en.wikipedia.org/wiki/Dasymetric_map

上图中,上上面的小图例是choropleth map,下面的小图例是网格等值区域图。该改进可以避免区域大小造成的错误印象。

3)变形地图 (Cartogram map)

等值区域图的缺点和质底图类似,即数据分布和区域大小不对称,导致在表达与面积无关的比率数据时会给人以错误印象。因此,等值区域图存在两种变形。一种是按照权重给地图区域变形,即所谓变形地图cartogram map;另一种是在地图中增加比例符号,作为一种权重因子,表示主数据的数目。相对而言,变形地图更为直观。变形地图的历史很悠久,可以追溯到18世纪中期。

上图是非连续性的cartogram map。反映此方法将地图中的区域按照属性值的大小放大或缩小,但是不能保证各个区域之间的相对位置,位置关系的改变可能会造成读者对地图识别的困难。

上图是连续型的cartogram map,该算法优先保证区域之间临接和相对位置不变,通过改变区域的形状以实现属性和面积成正比。上图可视化了2012年美国选举情况。面积与人数是正相关的,可以看到蓝色面积比红色要大。

不规则形状的cartogram map。其功能与非连续性的cartogram map类似,由于地区形状和位置改变较大,这种图通常需要一些文字标识相应的区域。

以上三张图片来自:

[1].    此图摘自:Dorling, D., WORLDMAPPER: the world as you ve never seen it before. IEEE - 2011 Semiconductor Conference Dresden: Technology, Design, Packaging, Simulation and Test, SCD 2011 - International Conference, Workshop and Table-Top Exhibition, 2006. 5(12): p. 757-764.

[2].   Shahbazyan, L. and G. Petkov, RecMap: Towards Modeling Recognition at Multiple Levels. Analogies: Integrating multiple cognitive abilities, 2007. 5: p. 77.

[3].    Heilmann, R., et al., Recmap: Rectangular map approximations. 2004, IEEE. p. 33--40.