数据可视化“学术”案例集萃
前文数据可视化商业案例集萃中,的确能发现一个规律,就是很多可视化作品,大多以传统BI中仪表板(dashboard)的方式呈现,酷炫一点的就是再借用一下地理信息可视化的内容。难道真如某些知乎大神所说,所谓数据可视化,就是雇几个NB设计师,把传统的仪表板重新设计包装一下?当然没这么简单。下文主要介绍一些国内外知名的数据可视化领域的学术范儿网站。在其中你能看到很多新颖的、非传统的可视化案例,哪怕是我们常见的统计图也有各种创新,让我们走上学术前沿拓宽眼界吧。
1.马里兰州立大学Ben Shneiderman教授个人网站
Ben Shneiderman教授是数据可视化领域的权威学者,生于1947年,是美国马里兰州立大学计算机科学系教授,人机互动实验室创建者,系统研究实验室和信息研究学院的附属教授。Ben Shneiderman教授早在80年代末就出名了,兴趣主要集中在人机交互、用户交互设计、信息可视化领域,近年来又转向社交领域研究,近期发表的论文有
Cohort comparison of event sequences with balanced integration of visual analytics and statistics,
Mapping Twitter Topic Networks: From Polarized Crowds to Community Clusters
他出版过好几本关于人机交互方面的权威教材,比如这本《用户界面设计——有效的人机交互策略》。Ben Shneiderman教授之前有名的成果有发明了矩形图,提出了界面设计的八大原则,以及提出了关于可视化交互设计的原则:首先查看概览,通过缩放和过滤,再继续按需查看细(overview first, zoom and filter, then details on demand)。
有趣的是,如2014年InfoVis最佳论文Multivariate Network Exploration and Presentation: From Detail to Overview via Selections and Aggregations,该工作首先展示给用户一副明细的多维网络图,并允许用户通过交互式的选择等操作对网络图进行聚集,以构造高层次结构的概览图。该论文挑战了可视化研究领军人物Ben Shneiderman所提出的可视化设计“魔咒”:首先查看概览,通过缩放和过滤,再继续按需查看细(overview first, zoom and filter, then details on demand),他们所提出的方法是先查看网络图的细节内容,再通过交互生成概览图,并在该过程中帮助用户理解图的网络结构,且最终生成的概览图能让更广泛的受众所理解。该论文获得最佳论文奖,表明大会不仅仅希望研究人员能够在可视化设计上做出突破,更是在鼓励研究者参与到可视化领域的基础研究中去。另外,有意思的是该论文第一作者的导师Jarke J. van Wijk曾建议将他们所设计的可视化系统命名为Namredienhs,也就是Shneiderman这一名字反过来拼写。作为德高望重的老教授,Shneiderman似乎也笑纳了晚辈的淘气。
Michael Friendly 教授是美国datavis领域的久负盛名的专家学者,生于1945年,在普林斯顿大学获得心理学博士学位,现就职于美国纽约大学心理学系。他除了在心理学方面的研究兴趣之外,还对数据分析、统计和计算机应用有广泛的经验。他是SAS统计图形的作者之一,Computational and Graphical Statistics and Statistical Science 杂志的副主编。最近的工作包括分类数据和多变量线性模型的图形化方法,以及数据可视化的历史的研究工作。
他的个人网站当然是资料丰富,内容多多。除了各种在线论文、课程、书籍的索引外,还有本文要重点推介的Data visualization Gallery。不同于其他类似的网站,Michael Friendly 教授将可视化案例划分入laurels(光荣榜)和darts(毛病榜),每个分类里都有很多案例。比如上图中就是darts榜中的一条目:evil pies的页面。虽然1801年饼图被Playfair发明的时候是一个好的统计图,可以方便地显示一个整体中各部分的对比关系,但是现在饼图的图形滥用几乎超过了其他任何图形形式。事实上由于人对于角度这个可视化通道远不如颜色、长度之类敏感,所以饼图不适合显示超过4个以上的对比内容。至于对饼图进行3D化、纹理化那就更看不出角度了。以下给出了各种案例来说明,非常有意思。
当然Michael Friendly 教授的网站远不止这些内容,有兴趣的童鞋可以自己去探索。
美国华盛顿大学的交互数据实验室在可视分析领域久负盛名,它的前身是斯坦福可视化小组( Stanford Visualization Group)。而斯坦福可视化小组是1990年由Pat Hanrahan教授成立的,该小组的博士在研究学习期间开发了Polaris 系统,毕业后在斯坦福产业孵化园找到了几个合伙人,如今该系统商业化的名字就是大名鼎鼎的tableau。
2009年Jeffrey Heer教授加入了斯坦福大学并领导了该小组, 这期间小组开发了更多的知名项目如D3.js and Protovis (led by Ph.D. student Mike Bostock), 新本文可视化工具 text visualization (与 Stanford NLP Group 合作)。2013年Jeffrey Heer教授和他的小组集体跳槽华盛顿大学,所以现在该小组改名为美国华盛顿大学交互数据实验室(UW Interactive Data Lab)。
按照他们网站首页的说法,他们的使命是提高人们的理解和沟通的能力,通过设计新的交互式系统的数据可视化和分析数据。显然,以他们的成绩完全担得起这个口号。每年他们都有论文发表在VIS、VAST、CSCW、EuroVis等可视化的知名会议上。他们的网站主体内容是历年来的论文、研究成果集萃。
目前该实验室进行中的项目有:面向交互式可视化的编程语言、可扩展系统和设计工具的开发;对可视化工作的评估试验;互动式语言翻译;从大规模文本分析到人口基因组的可视分析系统的开发。
4.北大可视化小组
如果说之前介绍的几个博客网站是世界一流团队的站点,那么接下来北大浙大的可视化小组站点就是国内一流。北大可视化小组的leader是袁晓如教授,他们实验室的研究简介、成员介绍、项目案例大家可以上他们小组的wiki查看,这里不赘述。
值得一提的是,每年都会举办北大可视化暑期学校,3个月前我前我刚刚从他们那里学了一圈归来,发了好几篇博客记载了当时所见所想。北大可视化小组的成员队员,不用说都是北大的精英,水平是相当高,英语是相当好,PPT配合视频做得很溜。他们也有一个官方博客,里面的文章主要是论文简述,对象是包括他们自己的论文在内的各种可视化相关论文。这些论文简述非常有用,尤其是啃英文原文比较费劲的同学,可以先看这些人家的简述,觉得有用再去读原文。看作者的姓名和发表日期可以知道,这些论文简述应该是他们小组内部的作业,每个学生一个月看一篇论文,写简述后发表在该网站上。我认为有志于学术研究的项目组应该学习人家的做法。
5.浙大可视化小组
正所谓南武当,北少林,北大可视化小组是中国可视化领域的少林,那么浙大可视化小组就是武当。去年浙大可视分析小组一口气在VAST大会上发了5篇论文(一共也就收录40多篇论文),可谓是中国可视化领域会议论文发表最好成绩。浙大可视化小组由陈为教授领导。陈为教授是个非常和蔼可亲的人,搬行李下地铁还不叫人帮忙。在我刚开始研究数据可视化的时候,国内的牛人我只认他。原因是他和沈则潜等编著了这本《大数据丛书:数据可视化》,是我2013年看过的国内最全最好的专著。为此我还专门做了个思维导图,记载我看这本书所了解的一切。
浙大可视化小组在陈为教授领导下很早就开了博客,内容也是以论文简述为主,但内容更丰富。首先很有用的是paper collection,由浙大学生整理了VAST、InfoVIS、SciVIS、EuroVIS、Pacific Visualization 等数据可视化知名会议的论文共享出来,可以各种下载;其次他们还在博客上分享了一套教学的PPT《可视化的基本原理和方法》,由陈为教授等编著,值得下载学习;他们实验室的研究项目和成果,可以在VAG Research看到;此外还有陈为教授的随感笔记,讨论了一些学术和生活的热点问题,比干看论文更有意思。再想起陈为老师的音容笑貌,仿佛他人就在眼前。
另外,浙大可视化小组今年来也建立了他们的wiki,3个月前内容还不是很完善,现在已经完善了很多。可以看得出,浙大可视化小组跟北大可视化小组之间的交流是很密切的。
6马匡六教授个人网站
马匡六教授现任加州戴维斯分校教授,VIDI lab (Visualization & interface Design Innovation lab)的leader。祖籍台湾,为目前华人在可视化领域成就最大者,他引领和开创了多个可视化研究方向(如高性能并行可视化、智能可视化与界面设计、可视化艺术设计),提出的基于binary swap的高效并行体可视化算法、结合数据挖掘的高维体数据分类算法、基于代码蠕虫的软件系统可视化系统、基于填充曲线的快速图布局算法等引起了科研界的巨大反响,被广泛应用于生命医学、材料、天文物理、气候模拟、地震模拟、湍流燃烧等领域的数据分析。他在国际重要学术期刊和会议上共发表200余篇论文,其中50余篇发表在可视化及相关领域(如超级计算、图形学)的顶级会议和期刊(包括ACM SIGGRAPH, IEEE Transaction on Visualization and Graphics, IEEE Visualization, SuperComputing)。他手下博士生华人相当多,打开其Team名单,照片几乎都是华人面孔。看来美国博士圈快被华人占领了此言非虚。
我跟马教授曾在ChinaViz会议上见过,我向他询问了“论文跟人撞题了怎么办”的问题。他的回答是,做研究,就得快。如果实在是撞题了,也不用放弃,可以寻找同一问题的不同角度,深入下去,找新的扩展点。
7.视物致知
所谓视物致知,就是可视化的文言说法啦。这个信息可视化主题的博客是沈则潜博士创建的。他师从加州大学戴维斯分校的马匡六老师,毕业后仍然在可视化圈活跃,他跟陈为教授也有各种合作关系。据说他在美国ebay研究院工作,我没有见过他。相对于上面介绍的网站,这个视物致知学术味稍微淡一点,更多地是以轻松地口吻,科普可视化的案例和故事。可以增进兴趣,启发灵感。不过遗憾的是,不知道什么原因,2014年以后在没有更新,他的微博现在也只干干转发之类的事。但愿一切还好。
最近两年“数据新闻”十分火爆,国内这个领域的领头羊可以说就是这个财经新闻网的数据可视化实验室。与之前实打实的学术机构不同,这个“实验室”其实是财经新闻网这个媒体公司自己内部的一个单位,负责人是黄志敏先生。黄志敏先生曾经是网易开创时代的6个员工之一,后来跳槽到财经新闻,现任首席技术官。因为工作性质的缘故,他来传媒大学作报告比较多,他们公司也有我们学校很多实习生,我跟他当面聊过很久。他对技术还是非常看重的,能在一家纯媒体公司养一些成本是普通文职人员数倍的程序员,也是相当有魄力的。他们之前做的一些案例,比如《周永康的人与财》、《中东地区的敌友关系》都收到了很不错的反响。
他们这个网站比起前面几个的学术化色彩更淡一些,主要偏向于信息可视化、信息图、数据新闻的相关案例研究。
9. 时序数据可视化案例综述
这个是一个非常好的站点,将各类时序数据可视化案例总结分类,每个图都有其来源论文,是可视化布局研究的重要参考。它的作者是来自德国的Christian Tominski博士和Wolfgang Aigner博士。其中前者的主要研究的是可视化的比较等理论层次较深的内容。此外,他对运动轨迹可视化,时序、时空数据可视化也有很深的造诣。在他的个人网站中有许多相关论文。
同上,不过重点在于树形数据。其作者显然跟Christian Tominski博士相互认识。没错,他就是Hans-Jörg Schulz博士,也来自德国。Hans-Jörg Schulz博士的主要研究内容是开发可视化和分析方法,以便于理解结构化数据,着重于图和超图结构。他目前就职于弗劳恩霍夫计算机图形研究所。他着迷于从数据结构角度研究数据,如异构,多尺度,多层次的数据。他的个人网站也是成果丰硕,非常酷炫。
=========================================================
(可以说目前数据可视化学术领域的形式是,美国成果最丰富,德国内容也不少,中国快速追赶。此外,从以上总结内容中我们还可以发现,每个大牛都有自己的网站。所以想成为大牛的骚年,别天天刷微X了,搞点实在的内容堆个网站吧!)
沙发[嘻嘻] 赞分享,大TC数据可视化可期也
辛苦迪总萃取第一道原液~[good]
厉害。。