chinaVis 2017论文分类思维导图和个人总结
chinavis 2017已于2017年7月17、18、19日在青岛举行。(会议介绍,会议网站链接)遗憾的是我因为公务缠身,未能与会。虽然如此,我依然根据会场报告整理了一份分类汇总性质的思维导图。整个思维导图的分类完全是按照我个人的基础研究+应用领域的标准进行划分。希望能为发现自己的兴趣点、追踪领域研究热点有所帮助。
在科学可视化领域,
- 目前专家们聚焦的热点是流场可视化,其中并行可视化技术是解决此类大规模科学数据计算的要点。北京大学、国防科技大学、天津大学、中物院高性能数值模拟软件中心等单位在此有相当多的研究成果。
- 在其他应用领域,天津大学张家万教授领导的团队在做莫高窟文物保护项目已经3年有余;山东大学的外科整形手术仿真中的实时交互锯骨,让我联想到兰医二院骨科类似的学术讨论,不知他们是否有联系?西南科技大学也在进行医学领域可视化交互设计研究。可以看到医学领域可视化方面的研究一直是方兴未艾。
在信息可视化领域,
- 在基础研究方面,本次会议有几场报告都是关于:“在信息可视化中使用科学可视化的思路进行方法设计是否有助于提高洞察力?”其中东北师范大学张慧杰老师的研究颇让我感兴趣。具体可以看这篇论文:《Correlation Visualization of Time-Varying Patterns for Multi-Variable Data》《SAMP-Viz: An Interactive Multivariable Volume Visualization Framework Based on Subspace Analysis and Multidimensional Projection》。
- 在工具框架方面,可以看到当今webGL和GIS系统等技术,在可视化应用开发中已经变得越来越重要。这让我联想到今年IEEE VIS 2017大会中Uber公司开发的Deck.gl高性能web可视化库,也是此两种技术的应用。浙大《The Design Space of Construction Tools for Information Visualization: A Survey》一文对当前信息可视化工具的功能、应用场景、设计原则进行了综述,并讨论了此领域的未来研究方向:基于网页的高效可视化实现、可视化结果的再加工和Debug、更便捷鲁棒的交互实现。
- 信息安全可视化一直是领域应用研究的热点。同济大学智能与大数据实验室的曹楠教授在会上作了“异常检测的可视化分析系统”的报告,将其过去5年来相关项目成果进行了总结,包括社交网络上用户异常行为的发现、高维数据离群值的发现、社会媒体异常信息传播的视觉分析、健康数据的文本聚类与异常探索等。就以上问题的共性,反映出传统的基于统计分析以及机器学习算法的异常检测技术,往往面临着两方面的挑战:其一,异常与正常之间往往没有明确的数学界定、如何定义异常往往因应用而定;其二,统计分析过程中用于训练模型或者验证分析结果的基本事实数据往往难以获得。正因为如此,极大的限制了异常检测技术的发展。通过设计可视化分析系统,借助人脑智能帮助界定异常,再投入计算机智能进行自动化发现,是针对此领域复杂问题的解决方案。
- 东北大学的谛听工业控制系统威胁感知平台,在会场上做了报告,据称其功能如下:为用户提供了查看工控服务、厂商、设备的搜索入口,用户也可根据搜索语法自定义搜索,通过可视化统计报告直观展示全球工控设备的区域分布情况、工控系统服务的使用和工控系统上常规服务开放情况。这套系统的漏洞扫描与分析数据库涵盖了CVE、CNNVD等国际和国家级漏洞库,为厂商提供安全解决方案。
- 艺术可视化是今年会议的一个新主题。就内容而言其实是艺术领域的数据的可视化。
- 图和文本可视化领域,令人最感兴趣的是天津大学的科技文献主题的可视化研究综述。因为这直接应用到各位科研人员的日常工作中去。以前见过马里兰州立大学的文献可视化分析软件的介绍,可惜没法直接使用。希望以后能有更多实用的产品,而不是曲高和寡的实验室技术。
在可视分析学领域:
- 认知方法研究中,较为令人感兴趣的是《可视分析中复杂认知活动研究》和《A Human-center Visual Analysis Tool for Cellular Network Evaluation》。(不过其文章尚未刊发,除非联系作者,否则一时看不到全文。)
- 在可视分析具体的应用案例与系统构成领域,可以看到其研究范围相当广泛,我根据数据来源简单地分了一个类,包括:物联网、制造业、交通、电信、智能城市、互联网、环保&食品安全、经济管理、医学。其中有些题目,因为与生活相关,让人一眼看上去就很有阅读的欲望,例如《基于张量分解的共享单车数据可视化分析》、《基于公交稀疏轨迹的城市交通可视化分析》、《eduCircle: 学生在校园中活动和消费数据的时空特征可视化》等。
个人总结:
- 做应用领域研究,比较棘手的方面是一是数据的获取,二是分析方向(或曰需求)的把握。往往是先有项目后有数据,而项目需求又决定了分析方向。可是没有成果如何有项目?没有项目如何有成果?打破这一鸡生蛋蛋生鸡的循环,关键是我们要能够通过初步研究获得一些成果。互联网上公开的数据还是太少(据称只占人类数据总量的5%),不过做初步研究写论文够用了。这让我联想到今年IEEE VIS 2017大会上的一个报告:德国凯泽斯劳滕工业大学的Benjamin Karer分享的信息稀疏情况下的可视化应用开发实践,他以自己多年来与公安、金融、国防等涉密机构进行合作时的经验,总结了如何在信息、数据和需求有限的情况下,进行可视化设计与合作开发的方法论。Benjamin提出以加强终端用户的试用和参与为驱动力,快速迭代开发模式,强调从用户对实际系统试用的反馈中寻找需求和需要更改的部分。换言之如果是初级研究,那么每周定时的讨论,以目标为导向的成果评价(例如论文check)是推进项目进展的重要方法。
- 从会上很多应用研究型论文和报告中可以发现,近年来可视化与机器学习的联系越来越紧密。机器学习模型需要使用可视化来分析模型性能,同时可视化也需要及其学习方法来检测重要信息。如果站在机器学习的角度,那么可视化不仅可以应用在训练数据的特征维度(比如数值属性和文本属性)和标签分布的分析上,也可以应用在用机器学习模型的最终输出结果的评价上。如果站在可视化角度,机器学习方法不仅有助于快速处理数据,也可以在可视化视图生成后辅助进行特征提取。比如高维数据,一般可以使用散点图、矩阵和平行坐标轴等可视化方法进行展示。为了进一步地揭示数据特征和模式,往往还需要使用降维方法(包括人工交互降维和算法降维)。之后生成的可视化视图,还可以使用标量场、向量场和张量场等方法研究数据点与周围邻居的关系,从而方便用户发现特征;当然也可以用计算机视觉等机器学习方法进一步地匹配和过滤特征。例如本届从chinavis会议上有很多使用主题模型(文本分析领域的一种传统机器学习方法)等向量化方法结合数据可视化的应用向论文。
- 从汇总列表的标签中可以看到,此次会议中参加高校的数量又创新高。浙江大学可视分析小组的报告和接收论文数量依然稳坐头把交椅。北大、山大也是权威级的山头。此外,西南科技大学虚拟现实与可视化实验室和同济大学人机交互及大数据可视化实验室,也给我留下深刻印象。
此图的交互版本链接:https://www.processon.com/view/link/5a031982e4b0d53d97964e8e
附录:chinaVis 2017挑战赛内容:
挑战1
“恭喜中大奖了!”、“您可以兑换银行卡积分了!”、“您需要无抵押银行贷款吗?”这类垃圾短信相信你一定收到过不少。用“伪基站”发送垃圾短信已成为不法分子诈骗、推销的新手段,特别是一些附带恶意链接的木马短信,用户点击后还会造成手机中毒和网银盗刷等现象。“伪基站”即假基站,能够搜集以其为中心、一定半径范围内的手机卡信息,利用GSM验证漏洞伪装成运营商的基站,冒用银行、运营商、国家机关或他人号码,强行向用户发送诈骗、色情、赌博、广告等短信息。不法人员利用伪基站发送短信,不仅干扰公共频率资源,影响人们的正常通讯,而且通过群发短信的方式发送内容不受控的短信息,严重侵害了社会秩序。
QHNet公司推出手机卫士应用软件,安装该软件的用户在收到垃圾短信时可以主动上报,这样手机卫士应用软件积累了大量被用户标注的垃圾短信样本数据,其中每一条短信都包含正文、接收时间、发送者号码以及接收该条垃圾短信前最后连接的正常合法基站信息。如果能够定位到伪基站发送垃圾短信时的位置就能帮助执法人员打击不法分子,但为了保护用户隐私,手机卫士应用软件并未获取用户的精确GPS位置信息。那么如何确定伪基站的位置信息呢?目前,我们将用户主动上报垃圾短信前最后连接的合法基站的位置,近似作为伪基站的位置。但伪基站有非常强的流动性,因此依据近似位置和传统数据分析方法,仍然很难准确把握伪基站的活动规律。QHNet公司这次将部分垃圾短信样本提供出来,希望您使用可视分析方法,揭示伪基站的行为模式,为有关部门建言打击伪基站的有效方案。
ChinaVis2017挑战赛入选的作品(作者:吕伟朝等)
挑战2
随着网络宽带进入千家万户,网吧这一曾经炙手可热的经营项目,现已举步维艰。于是,一些网吧经营者不惜采用接纳未成年人、通宵营业等违规经营方式来吸引顾客。某市正在开展严查有违规经营的黑网吧的专项执法行动,但网吧数量庞大,传统执法过程,即派遣专门人员挨个检查网吧,不仅耗时耗力,还为黑网吧提供了规避查处的准备时间。为了提升全局掌控能力和执法效率,某市公安局决定采用先进的数据分析技术,从网吧上网登记数据中识别不同上网人群,探索上网人群的时空行为特征,检测非法上网行为与团伙上网行为,为寻找黑网吧提供线索,为犯罪预防和维护社会公共安全提供新思路。作为数据分析爱好者的你,请根据某市公安局提供的网吧上网记录,通过可视分析及其它数据分析方法,帮助分析黑网吧生存现状并解决管理和执法中遇到的现实问题。
一等奖获得者东北大学高强作品