可视化案例综述网站导读2(未完待续)

上次博客我分享了一些可视化案例集萃。这些网站不仅图文并茂内容详实,而且其中很多其本身就是很好的数据探索可视化作品。学习这些网站的设计思想和制作技术,对我们加深数据可视化理解很有裨益。今天就其中特定数据类型相关的网站做个导读,以方便各位读者发掘可视化领域的各类金矿。

1. 文本可视化案例综述(http://textvis.lnu.se/

about:
Developed by Kostiantyn Kucher and Andreas Kerren
To cite this resource, please refer to the IEEE PacificVis 2015 short paper. Also, check out our earlier IEEE VIS 2014 poster abstract.

简介:

文本数据分析可谓数据科学中的基础研究领域,应用非常广泛。瑞士林奈大学ISOVIS小组基于本组在VIS2014和PacificVis大会上的综述文章,制作了此文本可视化案例综述网站,并一直更新到2017年,已囊括了400种文本数据相关的可视化论文。论文作者如果发现自己的作品没有被收录到此网站上,也可以直接在该网站上投稿。

可视化说明:

该网站本身也是很好的探索类可视化作品,以便于读者检索感兴趣的论文为目的。其主体部分是各个论文的缩略图,可以点击放大查看详细。左侧是导航面板,用以导航/过滤论文。从上到下依次是论文数量提示,文字搜索框,时间轴过滤器,历年论文数迷你图,分类选项。其分类选项的设置非常值得我们学习,其每一项内容如下:

  • 研究方向(都是文本分析的子方向):文本统计、演说分析、情感分析、立场分析、事件分析、趋势分析、词汇/语法分析、关联分析、翻译/文本对齐,其;
  • 研究对象:线社交平台(134)、通信数据(31)、专利(5)、报告/病例(40)、文学(47)、科技文献(40)、媒体(84);
  • 数据来源:文档(84)、语料库(318)、流数据(52)
  • 数据特征:地理特征(54)、时序特征(186)、网络结构特征(86);
  • 可视化的任务:发现兴趣区域(86)、聚类分类(292)、排序(321)、概览(372)、监控(43)、导航/探索(259)、不确定性问题处理(25)。
  • 可视化的呈现方式:包括种折线图/河流图(127)、像素/矩阵图(151)、节点链接图(130)、词云(152)、地图(118)、文本(193)、图标(103);

网站制作技术:

  • 后端: Ubuntu linux系统,apache2.4.18服务器端软件,使用的后端脚本语言无从判断,不过后端主要负责传输分类和内容信息两个json文件,这么简单python,php,java,nodejs谁都能干。
  • 前端:整体用bootstrap框架搭建。主体逻辑基于jquery类库自己写成。只用了一点点D3.js画了个迷你图。
  • 结论:简单易上手,初学者经过学习完全可以学会怎么制作一个类似的网站。

应用导读:

做邮件数据分析的同学,可以先这样过滤一下:研究方向去掉演说分析、词汇/语法分析、翻译分析;数据特征去掉地理特征;研究领域只选线社交平台和通信数据。这样过滤一下会只剩下131篇论文,然后用左上角的时间选择器,选近5年的论文,在其中挑自己感兴趣的几篇看看论文摘要和图片解释就行。我个人比较感兴趣Data Portraits (2016),iForum (2017),BrandSediments (2016)、ToPIN (2016)等文章。

2. 生物学可视化案例综述(http://biovis.lnu.se/

Developed by Andreas Kerren1, Kostiantyn Kucher1, Yuan-Fang Li2, and Falk Schreiber2, 3
To cite this resource, please refer to the PLOS ONE article. Also, check out our earlier EuroVis 2017 poster abstract.

简介:

该网站也是瑞士林奈大学ISOVIS小组制作的,总结了2000-2016年生物学相关的可视化案例。诸如基因图谱、蛋白质模型等案例共有146个。

可视化说明:

其网站与上一个例子基本相同。只是其主图部分改成了一个用D3js做的、影藏了连接线的节点链接图。该图可以缩放,可以聚焦。点击一篇论文,就能显示该论文与其他论文之间的引用关系(显示连接线)。点击advanced选项卡,可以调整主图内元素的布局权重,从而重新布局整个图。例如把year调整为最高权重,其他最低,那么论文会按时间排序,很容易找到最新一年发表的论文。总而言之很有趣。我觉得我们做可视化案例,至少也要做到这样的交互效果才行。

其分类选项的设置与上一个网站略有不同,大家可以看看有什么区别:

  • 数据类型:表格(51)、网络/图数据(64)、层次结构数据(24)、序列/文本数据(55)
  • 数据特征:时序(29)、序列(44)、空间(29)、列名(102)、定量(53)、不确定性(9);
  • 可视化的任务:导航、搜索、过滤、选择、排序、分类、注释、分享、向导。
  • 可视化的呈现方式:包括种折线图/河流图(127)、像素/矩阵图(151)、节点链接图(130)、词云(152)、地图(118)、文本(193)、图标(103);

网站制作技术:同上

应用导读:

生物学与我们的研究领域差距较大。没有点生物学知识基础,同样是常见的图表,其可视化是真心看不懂。我个人比较感兴趣里面的一篇文章:人类基因组可视化分析工具Epiviz。对于这个biovis网站,我们主要参考该网站本身的制作与分类方法。

3.时序数据可视化案例综述(http://vcg.informatik.uni-rostock.de/~ct/timeviz/timeviz.html

A Visual Survey of Visualization Techniques for Time-Oriented Data
by Christian Tominski and Wolfgang Aigner

简介:

此网站在我以前的博客中介绍过,是德国的两位大咖Christian TominskiWolfgang Aigner创建的,主要用以推销他们的专著Visualization of Time-Oriented Data。考虑到时序数据可视化应用的重要性和广泛性,这个网站在我每次写论文的时候都要打开看看。不过此网站制作较早,只有115篇文章,交互性和文章的新颖程度上没有瑞士林奈大学ISOVIS小组的网站好。

可视化说明:

其网站的布局和呈现方式与前文所述的网站基本相同。因为年代较早,所以更为简陋,缺少时间轴过滤器,不能按文章新旧排序。其分类选项也更为简单,都是从时序数据的特定出发,大致罗列如下:

  • 数据参考框架:通用,时空结合
  • 数据变量个数:单一变量,多个变量
  • 时间排列方式:线性,循环
  • 时间基元:时间点,时间区间;
  • 时间的可视化映射方式:静态图形,动态动画
  • 可视化呈现的维度:2D,3D

网站制作技术:

非常简单,纯HTML+CSS+JS做的静态网站。其中主体逻辑都是基于jquery实现的。

应用导读:

时间是一个非常重要的维度。随着时间变化的数据,或带有内在排列顺序的顺序数据统称之为时变数据或者时序数据,它们都可以映射到时间轴上进行处理。时序数据可视化应用在历史动力学、基因组测序、网络流量监控、经济数据分析、音乐和文学分析等方方面面,相关案例不胜枚举。

按照时间的映射方式,这些可视化大致分为两类:静态图形,动态动画。然而由于动画的优势和缺点都在于其完全吸引了用户的注意力,因此用户观察非动画的其他视觉通道会变得困难。目前可视化领域的主流观点是,由于人类认知的局限性,要审慎看待动画方式可视化时变数据的可行性与表现力。在这个网站中,纯粹用动画方式展示时间的案例,在115个案例中只有7个,可谓例证。

在以静态图形为可视化的案例中,又可以按时间排列方式分为线性或循环。线性方法通常将时间映射为时间轴,其他维度可以映射成折线、柱形、面积、色彩等。典型的例子如时序流图(timeRiver),用河流来比喻时间。子在桥上曰,逝者如斯夫。

Stacked Graphs,一个线性时间可视化案例。timeRiver的一种变体,适合呈现多个时序变量的变化趋势。Byron, L. & Wattenberg, M.: Stacked Graphs – Geometry & Aesthetics. IEEE Transactions on Visualization and Computer Graphics, Vol. 14, No. 6, 2008.

时序数据可视化方式,可分为制作时序流图的同学很有必要参考一下这个网站内容。

4.层次结构数据可视化案例综述(http://treevis.net/

treevis.net - A Visual Bibliography of Tree Visualization 2.0 by Hans-Jörg Schulz

此网站在我以前的博客中介绍过,是德国的Hans-Jörg Schulz博士创建的。层次结构数据或者称为树形结构数据的可视化,一直是可视化表达中最具创意的领域。可以看到诸多千奇百怪的设计,从维度上可分为2D,3D,2D+3D;按层次结构的表现形式可分为显性的,隐性的,复合的;从对其方式可以分为直角坐标系,径向坐标系,树形的。

该网站经过了重新制作,内容很新,2017年12月最后更新。
很多数据都是层次结构的,例如IP地址、局域网内主机拓扑结构(总有那么几个关键网关可以作为根节点)、公司人员组织结构等。适合做网络安全可视化分析、邮件数据分析、网络结构可视化的同学参考。

5.动态图数据可视化案例综述(http://dynamicgraphs.fbeck.com/

这是来自德国斯图加特大学VISUS小组的可视化作品。展示的是动态图数据(同时具有时序和网络结构特征的数据)可视化案例。其数据来源于 EuroVis 2014.该小组发表的文献综述,2015年以后未更新。考虑到图数据/网络结构数据应用的广泛性,该网站提供的内容亦极具参考价值。

该网站也是一个不错的可视化作品。可以创建标记,查看每年哪种关键字的论文最多。作为研究者,可以从它罗列的关键字中,发现此领域的主要研究内容和方法:

time: animation94,timeline80,generic15
paradigm: node-link135,matrix15,generic14
evaluation: case_study103,user_study25,survey16,none11,expert10
application: social45,generic42,document30,software_engineering30,infrastructure12,biology12
other: mental_map44,compound_graph28,3d24,general-purpose_layout22,force-directed_layout22,directed_graph20,radial18,weighted_graph18,juxtaposed_node-link15,online_problem15,offline_problem15,taxonomy12,special-purpose_layout12,superimposed_node-link11,clustering10,fixed_nodes10

可见图数据/网络结构数据的可视化呈现方式可以分为三大类:节点链接图、矩阵和传统统计图方法。值得参考。