北京R语言会议纪要

有幸参加了今年R语言会议,十年之后,我再一次来到帝都。不愧是北京的大学,人大的建筑一看就很大气!

这次R会盛况空前,演讲那么多,第二天还开了分会场,所以肯定是听不完的,加上我很担心第二天的讲座,所以我只认真听了部分的讲座(罪过罪过)。所以我只选择我印象深刻的内容讲一下。

1. Hadley Wickham : 我居然几乎全部听懂了Hadley说什么!大概因为我也做一点R开发的缘故吧。惭愧的是,听到这个讲座我才知道devtools这个包是他写的,而且我也没有用过。我就是那种用pakage.skeleton()做一个空包然后自己把代码填进去的人。有好用的工具一定要用,往节省人力的资源方向去才是正道啊!最后Hadley还吐槽了一番CRAN,怨念太深了!

2. David Smith : 他一上台先试拍了一张观众的照片,然后以观众为背景自拍了一张,好萌啊!不过他说的内容我没有怎么听懂。

3. 余凯:虽然我最近一直听说Deep learning,但直到现在还没有谁跟我认真地分析过“什么是Deep learning”,看来还是要读论文。

4. 周明:用计算机去做对联和绝句。老实说,我觉得这种思路是错的,但很不好意思,我想不到好的思路。但是我觉得诗词不是选择一个概率大的字词,而是选择一个最好的字词。这种事情,目前人工智能做不到。不过要是计算机能做到帮我完成各种应用文(包括申请书和给那些跟我不熟悉的上级的信件)那该多好!我觉得这个方向才是正路。

5. 王汉生:王老师也是非常萌的一个人,可惜我不做社交网络。统计基础也差,实在没有听懂(请轻揍)

下午是金融专场,这种高富帅领域好像真不适合我(说真的,经济学和金融的东西我真的读不下去,不知道是智商还是兴趣原因,希望是后者吧),不过腾讯工程师说的并行矩阵分解工具真的很厉害,可惜不开源就是了。后来我溜出去找当年睡在我下铺的兄弟福哥。感谢他带领我游览清华,还让我结识了另一个学霸飞哥。他们学电力的往往都是在实验室待到十一二点,实在让老衲惭愧啊!

第二天分了几个专场,所以不可能全部听完。

我先试在A场听。

6. James Wicker : 他做的工作和我师兄的工作有点相同,就是要分辨到底一堆样本中,包含了多少种分布,怎样把这些分布分辨出来。我觉得这个方向还挺有意思的:你可以将很多事情的发生看做很多因素的结果,每个因素对应一个概率分布,要是能把这些概率分辨出来,你就把这些因素理清楚了。当然这个问题很难,而且我还没入门。回头看看论文去。

其他的讲座我基本都忽略了,因为我下午要上台,非常紧张!

7. 任坤:任坤师兄的pipeR真的是一个很有用的包,尤其是像我这种经常要做数据清洗的人来说,这种管道符操作的方式很实用。

8. 邱怡轩:轩哥将SVD,深入浅出。他说的用SVD做矩阵补全,开了我的眼界,准备回头就用这种思路去做一下Kaggle最近的比赛。

总的来说,印象深刻的就是这几场演讲了。第二天分了三个会场,有些很想听的内容时间都冲突了,真是可惜。

 

R会以外的八卦:

1. 没想到南下和北上的高铁车型是不同的,回广州的车不同于去北京的车,热水间里面没有一次性纸杯,所以只好买了一瓶高铁上的矿泉水。

2. 高铁上冷气比较足,去的时候我是抱着带去换洗的衣服取暖的。回来的时候干脆一发狠,掏出电脑算个比较大的kmeans,让发热的电脑成为我的暖炉(何等码农做派!),回去路上不断看窗外,北方民居和南方民居真的有很大不同啊。那种平原景象很吸引我。

3.路上还看完了英文字幕的《处刑人》。

4.我爸问我,北京比起04年,有什么变化。我说,就只有地铁要安检这个变化,问了其他人,说,也就空气污染更严重了吧。

R语言 Comments(74) 2014年5月27日 07:03