可视化报表生成器案例综述:04 大数据魔镜
1年多前我曾经在自己本博客的文章我所涉及的数据可视化实现技术和工具 中阐述了web端实现数据可视化的好处,以及介绍了一些知名技术和工具,其中我对echart.js和D3.js大为赞赏。当时我就感到,echart已经把数据格式做的非常简单,普通前端开发者已经很容易调用他们。如果能在这个基础之上构建一个类似tableau的数据绑定工具,完全可以做一个针对普通用户的快速创建数据可视化案例的WebAPP。
不过大凡是自己能想到的点子,99%别人也能想到。限于客观条件我还没来得及实施,国内就有人做了类似的工作。这就是苏州国云数据科技有限公司开发的大数据魔镜。那么他们到底做到何种层度了呢?作为数据可视化方面的研究者和web前端开发者,虽然我对这个公司并不太了解,但还是饶有兴趣地试用了他们的产品,以下我只是对他们的产品做出论述。
大数据魔镜是一个典型的webApp产品,其目标是所有业务员都能够使用的数据分析/数据可视化工具。目前大数据魔镜有四个版本:云平台版、基础企业版、高级企业版和Hadoop 版。其中前两个产品大约类似于tableau online和tableau server,是免费的;后两个估计是企业定制项目,是需要洽谈的。我试用了其云平台版(其实就是Online版本)。下面讲讲我试用的情况。
注册账号,创建项目自不用说。创建完项目后第一步是选择数据源。虽然看起来可以选很多数据类型,但是目前只能选择连接mySql或者导入Excel。
有了数据,就可以直接创建图表。上图是这个大数据魔镜的图表生成页面。可以看到界面左侧是数据栏,大数据魔镜将数字格式的字段解析为度量(Y 轴),将非数字格式的字段解析为维度(X 轴),用户可以进行任意的拖拽“度量(Y 轴)”到列生成器中,拖拽“维度(X 轴)”到行生成器。点击最右侧的图表类型,即可基于echart.js快速生成图表。
以上demo中的示例图表。
有了图表,就可以制作仪表盘(dashboard)了。不过在这里仪表盘的功能极为简单,仅仅是将多个已制作好的图表排列起来,再起个名字。上图是我制作的简单demo.制作好的仪表板还可以共享给好友使用。前提是好友也注册了大数据魔镜的账号,你才能开发浏览权限给他。
总结:
个人感觉至少目前这个大数据魔镜的前端产品还处于草创阶段。它的web端拖拽式的图表编辑界面和仪表板编辑界面比较简陋,给人的感觉就是在echart的基础上套了一层jquery ui的壳,有点学生作品的感觉,有许多许多细节问题都没有来得及修饰。即使处于beta阶段的百度图说比起来,都差得很远。
从专业领域讲,数据可视化并不是简单地制造图表。前期的数据清洗重要性并不次于设计,没有好的清洗自然也不可能有后面的设计绘图。然而大数据魔镜的web端没有提供任何数据清洗的工具,甚至后期的修饰工具,诸如更改字段名、列名之类的选项都没有。数据处理如此初级,以至于拿它的excel demo数据源,做出的报表也好不到哪里去。就像上面我做的那个简单demo的图一样,乍看还行,但是仔细一看就会发现由于缺乏标注工具,图形意义不清。要改行列名还得跑去excel里面改。我总不能把图表的含义都写在备注里吧,那样可视化的一叶知秋特性不就没有了么。
就我看来,无论从功能、易用性和美学角度,大数据魔镜的产品是无法与国外tableau、qlikview这样的成熟产品相提并论的。想必是知道自己还差得很远,所以该产品现在免费使用,也算是不错了。总之,个人感觉至少目前这个大数据魔镜的前端产品还处于草创阶段。不过这个大数据魔镜的官网和blog倒是做得很好很全,什么企业邮箱QQ微博全都有,广告口号也非常响亮。所以我对它的判断是应该还处在融资阶段。至于其他,只能交给时间去检验了。
修改建议:
有道是不破不立,如果光是批评似乎也不太厚道,毕竟我也是搞此方面研究的,那么我就大言不惭地提出些改进意见吧。
- 前期的数据清洗的工作。数据清洗不是一个简单的内容,但对于数据可视化绝对是不可以忽略的内容。tableau有多数据表连接,数据混合(data blending, 将多数据表在公共维度上进行连接,又称动态连接),数据筛选(包含字段的选择、合并、重命名、创建组和层级)之类的功能。我觉得多数据表链接和数据混合要想做得好还是有点技术难度,但数据筛选至少应该有吧。
- web端编辑界面大应该幅度修改。现在这两部分给人的感觉就是在echart的基础上套了一层jquery ui的壳,而且根本没有用到echart和jquery ui的精髓,做出来的东西可定制性还没excel高。事实上,这两方面完全可以按照上诸如processOn之类的图表生成器的方式进行优化。echart里面有很多可定制组件,例如echart生成的图表上面的图例都是可以修改的,鼠标点击交互事件也是可以修改的,完全可以以此制作细致的属性修改和选择器。为了满足方面使用的需求,还可以增加一些定制化程度较高的组件和demo作为示范。
- 主题图来点原创的吧,都用开源的似乎不能体现一个大数据分析公司应有的霸气。
- 后期的数据修饰工作。包含描述文字的添加、字段名修改、备注修改、辅助组件和样式主题修改等等。细谈的话可以有很多。
赞一个,很客观的分析,你说的缺失的,高级企业版有的,建议我们会及时提交
很用心的总结.谢谢!