Time-Ray Maps: Visualization of spatial and temporal evolution of news stories

原文作者: J. Sheidin, J. Lanir, P. Bak, and T. Kuflik,来自于以色列海法大学和 IBM Watson Health, Foundational Innovation,发表于2017年EuroVis会议

概述

本文提出了一个名为:Time-Ray Maps(时间射线图)可视化方案。该方案旨在表示新闻报道的时间和空间演变。该方案既能使之与其他新闻报道进行比较,又能分析新闻报道的影响和演变。虽然该方法是专门为新闻事件设计的,但也适用于各种类型的时间序列数据,比如气候变化、流行病分析等。

本案例聚焦的新闻数据,其中有些概念需要先澄清。

  • 新闻条目(news item),代表在线新闻源中的单篇文章,也就是我们俗话说的一条新闻。每个新闻条目都包含发布时间戳、新闻来源、主题等内容。是新闻数据分析最原始的数据集。
  • 新闻事件/新闻情节(news episode)是指来源不同但阐述同一事实的若干新闻条目。可以理解为新闻条目按主题内容聚合而成的对象。
  • 新闻故事(news story)是由一系列新闻事件组成的连续剧。可以理解为按时序发展变化的、具有同一标签的新闻事件集合。

例如叙利亚内战就是一个连续的新闻故事,其中发生一次政治事件(例如土耳其越境攻击库尔德)就是一个新闻事件,伴随着这个新闻事件各国媒体报道了大量文章,每一个文章就是一个新闻条目。

本文主要关注的是新闻事件episode(news episode),特别是它在特定时间段内的发展,以及引发讨论的空间位置和范围。而这往往与之相关的新闻条目的数量有关。

可视化设计

Time-Ray Maps(时间射线图)的可视化设计如下。

受到阳光的启发,可视化设计整体呈径向布局,中心区域是一个可以交互的地球仪(world-map),用于标识新闻事件的起源位置。地球仪外边缘按钟表盘的方式布置了一个时间轴,以显示每个时间粒度(time-resolution)下发布了多少新闻条目。新闻条目的数量(Range of reports)用柱状图(bar)的高度来定义。

在展示数据之前,要先确定时间轴所展示的时间范围。展示的时间范围可以是一般钟表盘所显示的12小时(同时每个刻度对应分钟),也可以是一天24小时(同时每个刻度对应小时),甚至一个月30天(同时每个刻度对应天)。本可视化方案还支持比较不同的新闻事件,在这种情况下就要使用相同的时间范围,并让他们的开始时间对齐。

由于交互在可视化探索过程中非常重要,所以本方案也支持一些交互手段:

  1. tooltip:将鼠标悬停在柱状图上时,报告新闻确切数量,并显示具有代表性的新闻标题
  2. select:当点击某个场景的柱状图时,将在浏览器的新选项卡中打开对应的新闻页面
  3. interactive world map: 允许用户缩放和平移到地图上感兴趣的区域。由于使用的是地球仪,只能显示半个地球表面,所以地球仪的旋转和用户自主探索是不可或缺的。
  4. Time-segment selection:用户可以鼠标点击(单个bar)或者鼠标拖动(选择一串bar)来选择感兴趣的时间段。选择时间段后江都地图进行连接和刷选,突出显示相应时间段的信息。用户能够有效地探索新闻报道,加深对空间分布演变的理解

案例研究

本文使用从欧洲媒体监视器(EMM)中提取的数据。EMM[ STEINBERGER R., POULIQUEN B., VAN DER GOOT E.:
An introduction to the europe media monitor family of applications.
arXiv preprint arXiv:1309.5290 (2013)
]是一个新闻聚合系统,它监控3700多个新闻源,每天以60种语言收集超过100000篇新闻文章。EMM将文章聚集成报告同一事件的故事。本文作者使用该网站的RSS订阅对EMM上发布的热门新闻进行了6个月的追踪。对于每个新闻事件,我们收集了与新闻事件相关的所有新闻条目,包括确切的发布时间,这样我们就可以方便地计算出每个故事在任何时间跨度内新闻条目的数量。此外每篇文章也包括其新闻源的名称和位置。我们依据此数据源分析了叙利亚战争相关的新闻事件。

案例1

如上图描述了在48小时的时间里叙利亚战争的新闻故事,有两个完整的新闻事件:普京宣布从叙利亚撤军(蓝色)和库尔德宣布在叙利亚北部成立联邦(橘黄)。

蓝色的新闻事件从顶部开始,最初的报道零零落落,主要谈论的是俄罗斯对阿萨德总统的支持,以及俄罗斯撤军的可能意图。过了几小时,我们在新闻条目中看到了一个峰值(图中A区域),这一高峰与俄罗斯不会实际下令从叙利亚撤军的大量报道相对应。由于这个新闻有点出乎意料,具有许多政治影响,因此在一段相对较长的时期内(大约6小时)产生了许多新闻条目。我们看到第二个峰值开始于晚些时候(图中B区域),这与俄国军机实际撤离的报告相对应。

第二个新闻事件用橙色标出,报道了库尔德人打算宣布在叙利亚北部建立一个联邦地区。虽然与第一个新闻事件没有太强的关联,但我们可以看到世界注意力从一个故事转移到另一个故事。

案例2

从本文所述的可视化案例中也可以进行模式发现。

  • 上图a显示了一个本地新闻模式,其中新闻条目在相当短的时间内迅速增加,然后逐渐消失。快峰预示着一个意想不到的事件,并且影响范围不超过一个国家(因为地图上只标注了一个国家:德国)。例如,这可能代表了刚刚爆发的一场当地名人丑闻。
  • 图b显示了一个可比的模式,虽然峰值和形状的方向不同,但其中新闻条目逐渐增加,并在时间段结束时达到峰值,达到峰值后下降速度明显加快。例如,这种模式可以是欧洲国家主要政党的初选,因为这是一个事先知道的事件,在事件本身达到顶峰。这个例子在全欧洲都有影响,因此可能会引起许多欧盟成员国的兴趣。
  • 最后,图c显示了一个有两个新闻事件的新闻故事,其中一个讨论被另一个具有相似程度的讨论所取代。

讨论和展望

传统的新闻可视化案例如ThemeRiver、EventRiver、leadline、cloudline等,关注点都集中在时间流的可视化及流之间的关系上。而本文所描述的Time-Ray Maps,更侧重于单个新闻事件的模式发现和时空规律探索上。

Time-Ray Maps采用了径向布局的时间轴,这样做的好处是紧凑节省可视空间,缺点是难以进行数值的精确比较。

Time-Ray Maps的一大功能是对比同一个新闻故事的两个事件。例如,关于疫情这个新闻故事,可以有口罩生产情况、失业率等过多个新闻事件同时发生。绘制这种时间上重叠的新闻事件,本文有两种解决方案:其一,绘制堆叠的条形图,每个堆叠对应一个事件。其二,我们可以使用不透明度叠加显示两种颜色的新闻事件,这是之前案例所采用的方案。此外,设计泳道和互动(点击泳道可以隐藏或显示某一类事件)可以提供进一步的帮助。然而,这种方法在同时发生的事件太多情况下是不可扩展的。

有很多相关工作都是对新闻事件的其他属性(如情感、社会互动或主题)的可视化上。因此Time-Ray Maps的改进可以研究如何展示这些信息。例如,用颜色映射情感、按图表中峰值变化显示相应的标签。

最后,我们使用choropleth地图来表示每个国家的新闻条目来源。这一选择可能有失偏颇,因为大国如美国,可能有大量新闻条目来源于它,而有的非洲国家如索马里恐怕永远都不会被高亮显示。克服这一问题的一个可能办法是,按人口或通讯社数量使国家的面积归一化。然后使用等面积投影画地图。此外,由于使用了圆形布局,很难同时高效地显示整个世界,这使得交互(缩放和平移)必不可少。