数据可视化“商业”案例集萃
有道是知己知彼百战不殆,设计可视化案例的时候,少不了参考很多成功案例,才能将我们自己的设计给完善。以下我将自己两年来收藏的镇场之宝给大家分享出来,希望大家都能从中获得启发。
为了跟网络上已有的可视化案例分享文章相区别,我分享的站点都是gallery性质的,即每一个站点都是个展览馆,包含n个案例的索引;有些个案虽然十分好,诸如网站星球或者卡巴斯基的cybermap,但是毕竟内容单一,所以并不会包含在下文中;考虑到我们的工作需求,分享的案例会更侧重于学术领域,因此将分享的站点分为商业案例、学术案例、编程案例三大类,以图从设计、论文撰写和编程实现三个角度各寻找一批参考。考虑到工作需要,所找案例会多偏学术一些。本文先讲述其中的商业案例(包括一些国家、国际机构的案例)。
1. 国家数据
这个网站直属于中华人民共和国国家统计局。新时代我们要拿数据说话,尤其是对于做专业研究的童鞋。国家统计局的数据可信度高,质量好,可以下载(不过遗憾的是身边偏偏有些不信正史信野史的人 ,只能一笑置之)。国家统计局雇佣了很多专业公司比如超图软件,结合统计局的数据做了很多好看实用的可视化案例,比如第三次全国经济普查数据可视化系统,数据地图等等。可能因为一些技术因素,超图软件比较喜欢flash来做案例。此外,国家数据网站给出的可视化成果都比较宏观,普通人需要有一定国计民生的常识才能在其上找出有用线索。
2.世界银行
前面那个是中国的,这个则是世界的,让你直接跟世界接轨。该网站不仅直接提供了很多数据集的API接口,还有很多专业的可视化案例。不过其中用到了一些youtube的内容,否则会像上图一样出现显示不全的问题,所以最好在翻墙的条件下查看。
3. 百度大数据平台
不管你对BAT有什么看法,但此三家公司无疑是中国互联网数据分析相关领域执牛耳者。2012年时,百度就已经确定要以大数据作为未来公司发展的重要合力点。他们的野心是“通过大数据连接3600行,让大数据成为商业新能源”宏大蓝图,就目前所做的实际成品来看,百度公司的很多相关案例,比以上站点更接地气,值得借鉴。令人欣喜的是,百度现在以一种开放的态度来做这个“百度大数据+”平台,实际包含着百度众多业务,其中部分数据可以下载或提供API做二次开发。其中特别值得指出的是:
百度统计:众所周知web网站都是需要维护的,需要推广的,需要SEO的,尤其是商业网站。百度统计就是为这些网站提供数据分析业务。我们可以在百度统计的展示网站上看到很多有趣的案例,如上图所示每个服务不论是移动统计、流量研究院还是百度推荐,都有很多的案例展示,非常值得借鉴。首页上方的成功案例,其实比很多市面上卖的数据分析案例集这样的书更容易带你入门。
百度地图|人气 使用百度地图API搭建的非常酷炫的案例集合,包含曾大红大热的百度迁徙、景区热力图、百度慧眼、通勤图等内容。实用,参考价值大。对于要做类似的开发的我们,其背后的百度LBS开放平台的相关文档也是非常重要的。
百度预测-大数据 知天下: 这个也是百度2013年左右做的商业展示性质的页面,既美观又实用,号称预测准确率超80%。包含很多有意思的内容,包含像世界杯预测、欧洲赛事预测、高考预测、经济指数预测这样有意思案例展示,界面也很美观。
除以上之外,百度还有面向营销决策的百度司南,百度舆情。但是这些服务只面对企业级用户开放,一年收费25000,作为研究者我也很想一窥究竟,申请了试用,但是还没实际用上。就不谈了。
淘宝指数、百度指数、360指数是这阿里、百度、奇虎360这三家公司各自的免费数据分享平台。这三个指数有很大的共性,都是依托各自公司收集的数据,按照关键词进行查询,结果都做了搜索趋势分析(时序折线图、需求趋势图)、人群画像(按性别、地域、人群类型等),最后都用可视化仪表盘的方式呈现出来。
虽然形式上有类似之处,由于每家公司的特点不同,这三个指数也各有侧重。淘宝指数数据源主要是淘宝自己的搜索交易数据,侧重于经济内容,对人群属性的划分更为精确。就本人使用体会而言,这个淘宝指数实用性很强,在设计上可谓是国内dashboard(仪表板)长期以来的标杆。如上图中对比展示神舟、惠普、联想三个品牌名称,所产生的报表中包含 最近数个月的搜索指数曲线图,搜索情况地域细分图,人群分布图,对看图有困难的人士提供了趋势上升或下降的简报,信息十分丰富。通过此图我们可以发现神舟和惠普的搜索基本在一个数量级上,并且神舟持续上升有超过惠普的可能,联想虽然过去影响力很高,但是目前是持续走低,估计跟“美国良心”的舆论评价有关。人群分布上以男性IT人士居多,此外品牌影响力对于女性的指引非常明显(这让我联想到波伏娃所著《第二性》中对女性崇尚权威的论断)。更进一步,阿里还有一个阿里指数,是一个比淘宝指数更专业化的、面向商户群体的数据共享平台。
相对而言,百度指数和360指数更为类似,都是以网民行为数据为基础,连展示方式都极为类似,都是划分为走势分析、需求图谱和人群特征(乍看上去百度多一个舆情管家,但实际上360是把类似百度的舆情管家的功能放到了需求图谱中)。
过去是百度一家独大,现在360在PC端已经不亚于百度,在移动端也在快速跟上,所以这两家的指数产品完全可以做竞品分析了。就本人使用体验而言,百度除了数据积累上有优势以外(可以查询2011年以后的数据,而360只有2013年以后的数据),其他方面二者不相上下。
关于自定义搜索词,在百度是要收费的,因为这与百度对商家产品推广进行收费的策略有关。有些经理人为了提高账面数据使用了各种手段刷百度指数淘宝指数,相对而言360的好搜要干净一些。
除了这三大指数外,还有优酷视频指数,新浪的微博指数等产品,但是做的都没这三者好,就不赘述了。
5. IBM先进可视化实验室
IBM公司在商业智能领域一直都比较领先。他们的可视化实验室出版过大量研究报告、发表过各种论文、尝试过各种设计。如果把cognos和SPSS都算作可视化案例的话,那IBM的作品真是说不尽道不完了。
此外,页面上IBM的many eyes项目也值得一提。ManyEyes来自IBM研究院的Visual Communication Lab。Martin Wattenberg和Fernanda Viégas两人开始这个项目的初衷是希望能普及可视化,让人人都能把自己感兴趣的数据生成漂亮的图表。比如Martin Wattenberg的Baby NameVoyager可视化了过去一百多年来美国人名字的变化趋势。于是这两位牛人于2007年开创了这个Many eyes项目,网站提供了免费的可视化服务,你只要上传你的数据,就可以得到你想要的可视化图表。ManyEyes提供了数十种最受欢迎的可视化方案。某种程度上, many eyes就是现在满大街的在线数据可视化网站的先驱。
infomation aesthetics网站曾对目前最大的三个免费在线社交可视化工具Swivel, IBM Many Eyes, 和 Tableau Public都做了一番评述,对tableau public 的评价不低。tableau public gallery是一个将无数使用tableau public制作的交互式可视化案例集结起来的展览馆,考虑到我们已经全面地在学习使用tableau来做一些可视化探索工作了,为此上tableau public gallery调研其他人的案例就非常重要,尤其是学习其交互式案例的设计。
不过,tableau public gallery虽名为“public”, 但似乎只共享了tableau公司方面认为的特色工作簿,并不能搜索到我以前用tableau public做的案例,这也许是因为tableau公司想要控制显示的内容。不过就算如此,东西也多到看不完了。
shiny 本质上是R的一个交互式可视化扩展包,可以做一些交互式的web应用,有点类似tableau public。而这个shiny gallery,就类似于tableau public gallery,是shiny的案例展览馆。从中我们可以看到很多有趣的案例,可以作为我们设计案例的参考。
不过需要提醒注意的是,要写一个界面漂亮的shiny程序还是挺麻烦的,数据量一大各种崩溃也是家常便饭。这个工具最好只做整理好的小数据集的交互展示。
好文一定要顶,支持一下