博士第一学年结束总结

前言:

本学年开始的时候,面对变化较大的学习工作还是生活状态,我都有些不太适应。一方面已经工作了亲戚和同学各种买车买房结婚生娃,感觉自己就要脱节了似的压力巨大;另一方面博士就是比硕士压力大,要求多,各种跑路干活还得兼顾论文,确实不容易;不过现在我都挺过来了。其实我并不急于改变自己的生活状态,只要给我个宅窝写写代码画个画就行,好养活,从不挑食。

6月以来又送走了一批师哥师弟,我熟识的人又少了一批。铁打的营盘流水的兵,哭也没办法呀。现在别说凑和5人黑倒塔,连3人斗地主都没得斗。研究是一个人搞,学习是一个人搞,娱乐也是一个人。必须得果断突破困境,在各个方面结实新人去。

7月份以来我确实是有点忙。上上周写论文连续通宵了3晚上,导致第四天时差倒不过来,依旧是美国时间,结果又失眠一晚上。最近一周又是忙着搞开发。总之7月就没休息过,博客也断更了3周。但是正因如此,一直以来让我踌躇的论文问题终于有了眉目,算是稍微安心了些。

LinMinmay

-------------------------------------------------------------------------------------------------------------------------------------------------

关于博客:

很多人不理解,光看你一周一篇博客发在自己的网站上,好像也没什么人看啊,花这么大精力干什么。其实博客的主要价值在于记录对于自己有用的、经过自己思考的信息,算是高端备忘录。而且博客这东西重在坚持,偶尔发一两篇更加不会有什么影响力。如果为了凑数直接转载别人的文章,那么就跟微信上铺天盖地转发的心灵鸡汤和廉价成功学一样没有意义。博客一定得是经过自己咀嚼消化过的文字,才有令自己能快速联想,反复查阅的价值。本学年以来种种事件,不论是写论文也好,给别人授课也好,扩大影响力也好,开始的时候都是从博客的资料中出发。可见我的道路没走错,而我也基本做到了每周发一篇博客。当然不足点也有,那就是应该多找一些其他地方同时投稿,以扩大影响因子。目前在博客园我也有个场子,但是同步过去比较麻烦,真想快点搞个同步工具。

曾经我还想把写博客做记录这种方式推广到全实验室的研究生当中去。但是大多数人都坚持不住,得要靠我催,那就没意思了。当初在新浪云计算部门领导可是要求每天一篇英文博客的。最近我一直关注浙大可视化小组,似乎内部也有写博客的规矩。当然,我估计大部分人还是坚持不住。但是,要追求进步,就得跟做得好的比,不要跟差的比。例如这个浙大计算机科学女硕士,已经累计发博客440篇,涉及到数据挖掘机器学习到个人生活各种类型,而且大多数内容非常充实,被评为CSDN博客专家当之无愧,跟她一比,我都汗颜得很。像这种级别的人物,毕业时讨论的就不是找什么工作来糊口,而是这个工作能不能实现自我价值。

------------------------------------------------------------------------------------------------------------------------------------------------

关于可视化:

其实国内数据可视化领域,也就是从2012年以后才开始火的。以前都把它归入计算机图形学一类,进行专门研究的人极少。实际上,数据可视化并不等同于计算机图形学的子集。它并不是单一的表现方法,而是更适合与数据分析流程绑定,进行交互式知识发现。由此发展出三个分支:信息可视化,数据可视化,可视分析学。这两年,随着大数据分析在国内逐步升温,数据可视化已经被提到一个重要位置上来。语音学专家洪小文(微软亚洲研究院院长),用简单的比喻说明了大数据可视化研究的价值和要点:

1. 可视化和早期的Cobra编程语言有类似之处。Cobra看起来很不成熟的样子,但在商务里面用得很广,因为领导都能看得懂。可视化也一样,专门给领导看的。数据中的关键东西做出可视化,给领导一讲,马上就懂了。

2. 那有人问,我们不是已经有各种报表了吗?大数据的可视化一定是互动的(Interactive)。如果是报表里的图,领导如果想看点儿别的东西,你说,那我回去准备一下。等你准备好再回来,决策的时机可能就没有了。互动的可视化系统,只要一点,新的图就马上生成了。

3. 可视化系统不能让工程师来做。让他们来做,又搞出个matlab一样的东西,领导又看不懂了。现在很多startup已经做出不少很不错的产品了。

浙大陈为教授的博客中所讲,他去美国访问的几个学校,碰到好几个教授,都说美国现在可视化开始火起来,10余所学校招数据可视化的新faculty,但是难以招到合格的人才。由此凸显长期不受重视所造成的稀缺性。国内相关人才也极少,这就是一个很大的发展机会。

下半学年我的研究终于步入正轨。整个理论体系我已经有过初步的研究,这在之前的10篇博客都有反映。这里再记录一下我最近特别关注的此领域大牛:

国外:tableau公司;马里兰大学Ben Shneiderman教授;IBM Graphics and Visualization;华盛顿大学 Jeffrey Heer (D3)

国内:浙大VAS小组,陈为教授,陶煜波博士等; 清华大学计算机系 图形图像与可视化 研究组;百度前端可视化小组

目前我缺乏的是与实际需求结合的应用场景。不过我已经着手在做。预计10月份以后会有内容发表。另一方面,为免陷入“独自研究”的困境,我有必要近期内主动联系本校内愿意做或正在做相关研究的老师和学生。目前有三个不同领域的实验室我正想拜访,可在下学期开学时,正好是我稍微有些成果的时候。

暑期阶段我还是以专心开发为要务。坦白的讲,d3+angularjs并不是很好写,d3的语法更类似jquery。其实我最近还是颇总结了一批学习资料的,不论是关于可视化还是angularjs或者d3的内容。但是还未做足够整理,所以暂时按下不发。8月份以后会陆续发出来。

------------------------------------------------------------------------------------------------------------------------------------------------

关于绘画:

过去我总是追求于模仿一个画家(美树本晴彦)的风格。通过在本杰明插画培训班的学习,开拓了我的眼界。这里有必要把我最近特别关注的画家的姓名罗列一下,做个备份:

日本:  美树本晴彦,空山基,碧风羽, 崛部秀郎,森熏, 誉,沙村广明

新加坡:Stanley Lau

美国:Craig Mullins, Luke Mancini

国内:  李铭,张彬(本杰明), 刘远,阮佳,冯伟,王嵩(第七个橘子),  疾速k,LighTofHeaveN

现在我已经深刻得认识到自己的缺点在于绘画基本功的缺憾,包括透视、人体结构、明暗关系这些基础。我改变了我一个月画一副好图的做法,改为就画带明暗关系的速写,一天画一副。从本周已经开始,目前画了3副。说实话这个更难坚持,但是回报也更为长久。想曾国藩每天早上起来必临摹一帖陶冶身心,画画其实对我而言更接近于此。2015年7月出本子的计划不变。最后我们以插画家碧风羽的话来勉励自己吧:

“想提高技术,果然还是要每天都坚持画画。”

“不是仅靠想象,而是要把实物放在眼前来画是很重要的。”

“总而言之就是不透过别人的眼睛,而是自己来观察。”

“到外面走走看看,绝对会有迄今为止都未曾注意到的新发现。”