可视化案例综述网站导读2(未完待续)
文章目录[隐藏]
上次博客我分享了一些可视化案例集萃。这些网站不仅图文并茂内容详实,而且其中很多其本身就是很好的数据探索可视化作品。学习这些网站的设计思想和制作技术,对我们加深数据可视化理解很有裨益。今天就其中特定数据类型相关的网站做个导读,以方便各位读者发掘可视化领域的各类金矿。
1. 文本可视化案例综述(http://textvis.lnu.se/)
简介:
文本数据分析可谓数据科学中的基础研究领域,应用非常广泛。瑞士林奈大学ISOVIS小组基于本组在VIS2014和PacificVis大会上的综述文章,制作了此文本可视化案例综述网站,并一直更新到2017年,已囊括了400种文本数据相关的可视化论文。论文作者如果发现自己的作品没有被收录到此网站上,也可以直接在该网站上投稿。
可视化说明:
该网站本身也是很好的探索类可视化作品,以便于读者检索感兴趣的论文为目的。其主体部分是各个论文的缩略图,可以点击放大查看详细。左侧是导航面板,用以导航/过滤论文。从上到下依次是论文数量提示,文字搜索框,时间轴过滤器,历年论文数迷你图,分类选项。其分类选项的设置非常值得我们学习,其每一项内容如下:
- 研究方向(都是文本分析的子方向):文本统计、演说分析、情感分析、立场分析、事件分析、趋势分析、词汇/语法分析、关联分析、翻译/文本对齐,其;
- 研究对象:线社交平台(134)、通信数据(31)、专利(5)、报告/病例(40)、文学(47)、科技文献(40)、媒体(84);
- 数据来源:文档(84)、语料库(318)、流数据(52)
- 数据特征:地理特征(54)、时序特征(186)、网络结构特征(86);
- 可视化的任务:发现兴趣区域(86)、聚类分类(292)、排序(321)、概览(372)、监控(43)、导航/探索(259)、不确定性问题处理(25)。
- 可视化的呈现方式:包括种折线图/河流图(127)、像素/矩阵图(151)、节点链接图(130)、词云(152)、地图(118)、文本(193)、图标(103);
网站制作技术:
- 后端: Ubuntu linux系统,apache2.4.18服务器端软件,使用的后端脚本语言无从判断,不过后端主要负责传输分类和内容信息两个json文件,这么简单python,php,java,nodejs谁都能干。
- 前端:整体用bootstrap框架搭建。主体逻辑基于jquery类库自己写成。只用了一点点D3.js画了个迷你图。
- 结论:简单易上手,初学者经过学习完全可以学会怎么制作一个类似的网站。
应用导读:
做邮件数据分析的同学,可以先这样过滤一下:研究方向去掉演说分析、词汇/语法分析、翻译分析;数据特征去掉地理特征;研究领域只选线社交平台和通信数据。这样过滤一下会只剩下131篇论文,然后用左上角的时间选择器,选近5年的论文,在其中挑自己感兴趣的几篇看看论文摘要和图片解释就行。我个人比较感兴趣Data Portraits (2016),iForum (2017),BrandSediments (2016)、ToPIN (2016)等文章。
2. 生物学可视化案例综述(http://biovis.lnu.se/)
简介:
该网站也是瑞士林奈大学ISOVIS小组制作的,总结了2000-2016年生物学相关的可视化案例。诸如基因图谱、蛋白质模型等案例共有146个。
可视化说明:
其网站与上一个例子基本相同。只是其主图部分改成了一个用D3js做的、影藏了连接线的节点链接图。该图可以缩放,可以聚焦。点击一篇论文,就能显示该论文与其他论文之间的引用关系(显示连接线)。点击advanced选项卡,可以调整主图内元素的布局权重,从而重新布局整个图。例如把year调整为最高权重,其他最低,那么论文会按时间排序,很容易找到最新一年发表的论文。总而言之很有趣。我觉得我们做可视化案例,至少也要做到这样的交互效果才行。
其分类选项的设置与上一个网站略有不同,大家可以看看有什么区别:
- 数据类型:表格(51)、网络/图数据(64)、层次结构数据(24)、序列/文本数据(55)
- 数据特征:时序(29)、序列(44)、空间(29)、列名(102)、定量(53)、不确定性(9);
- 可视化的任务:导航、搜索、过滤、选择、排序、分类、注释、分享、向导。
- 可视化的呈现方式:包括种折线图/河流图(127)、像素/矩阵图(151)、节点链接图(130)、词云(152)、地图(118)、文本(193)、图标(103);
网站制作技术:同上
应用导读:
生物学与我们的研究领域差距较大。没有点生物学知识基础,同样是常见的图表,其可视化是真心看不懂。我个人比较感兴趣里面的一篇文章:人类基因组可视化分析工具Epiviz。对于这个biovis网站,我们主要参考该网站本身的制作与分类方法。
by Christian Tominski and Wolfgang Aigner
简介:
此网站在我以前的博客中介绍过,是德国的两位大咖Christian Tominski和Wolfgang Aigner创建的,主要用以推销他们的专著Visualization of Time-Oriented Data。考虑到时序数据可视化应用的重要性和广泛性,这个网站在我每次写论文的时候都要打开看看。不过此网站制作较早,只有115篇文章,交互性和文章的新颖程度上没有瑞士林奈大学ISOVIS小组的网站好。
可视化说明:
其网站的布局和呈现方式与前文所述的网站基本相同。因为年代较早,所以更为简陋,缺少时间轴过滤器,不能按文章新旧排序。其分类选项也更为简单,都是从时序数据的特定出发,大致罗列如下:
- 数据参考框架:通用,时空结合
- 数据变量个数:单一变量,多个变量
- 时间排列方式:线性,循环
- 时间基元:时间点,时间区间;
- 时间的可视化映射方式:静态图形,动态动画
- 可视化呈现的维度:2D,3D
网站制作技术:
非常简单,纯HTML+CSS+JS做的静态网站。其中主体逻辑都是基于jquery实现的。
应用导读:
时间是一个非常重要的维度。随着时间变化的数据,或带有内在排列顺序的顺序数据统称之为时变数据或者时序数据,它们都可以映射到时间轴上进行处理。时序数据可视化应用在历史动力学、基因组测序、网络流量监控、经济数据分析、音乐和文学分析等方方面面,相关案例不胜枚举。
按照时间的映射方式,这些可视化大致分为两类:静态图形,动态动画。然而由于动画的优势和缺点都在于其完全吸引了用户的注意力,因此用户观察非动画的其他视觉通道会变得困难。目前可视化领域的主流观点是,由于人类认知的局限性,要审慎看待动画方式可视化时变数据的可行性与表现力。在这个网站中,纯粹用动画方式展示时间的案例,在115个案例中只有7个,可谓例证。
在以静态图形为可视化的案例中,又可以按时间排列方式分为线性或循环。线性方法通常将时间映射为时间轴,其他维度可以映射成折线、柱形、面积、色彩等。典型的例子如时序流图(timeRiver),用河流来比喻时间。子在桥上曰,逝者如斯夫。
Stacked Graphs,一个线性时间可视化案例。timeRiver的一种变体,适合呈现多个时序变量的变化趋势。Byron, L. & Wattenberg, M.: Stacked Graphs – Geometry & Aesthetics. IEEE Transactions on Visualization and Computer Graphics, Vol. 14, No. 6, 2008.
时序数据可视化方式,可分为制作时序流图的同学很有必要参考一下这个网站内容。
4.层次结构数据可视化案例综述(http://treevis.net/)
此网站在我以前的博客中介绍过,是德国的Hans-Jörg Schulz博士创建的。层次结构数据或者称为树形结构数据的可视化,一直是可视化表达中最具创意的领域。可以看到诸多千奇百怪的设计,从维度上可分为2D,3D,2D+3D;按层次结构的表现形式可分为显性的,隐性的,复合的;从对其方式可以分为直角坐标系,径向坐标系,树形的。
5.动态图数据可视化案例综述(http://dynamicgraphs.fbeck.com/)
- Fabian Beck, VISUS, University of Stuttgart
- Michael Burch, VISUS, University of Stuttgart
- Stephan Diehl, University of Trier
- Daniel Weiskopf, VISUS, University of Stuttgart
这是来自德国斯图加特大学VISUS小组的可视化作品。展示的是动态图数据(同时具有时序和网络结构特征的数据)可视化案例。其数据来源于 EuroVis 2014.该小组发表的文献综述,2015年以后未更新。考虑到图数据/网络结构数据应用的广泛性,该网站提供的内容亦极具参考价值。
该网站也是一个不错的可视化作品。可以创建标记,查看每年哪种关键字的论文最多。作为研究者,可以从它罗列的关键字中,发现此领域的主要研究内容和方法:
time: animation94,timeline80,generic15
paradigm: node-link135,matrix15,generic14
evaluation: case_study103,user_study25,survey16,none11,expert10
application: social45,generic42,document30,software_engineering30,infrastructure12,biology12
other: mental_map44,compound_graph28,3d24,general-purpose_layout22,force-directed_layout22,directed_graph20,radial18,weighted_graph18,juxtaposed_node-link15,online_problem15,offline_problem15,taxonomy12,special-purpose_layout12,superimposed_node-link11,clustering10,fixed_nodes10
可见图数据/网络结构数据的可视化呈现方式可以分为三大类:节点链接图、矩阵和传统统计图方法。值得参考。