2015.10.26
来IBM已经整整两个月了,一直没试着去记录什么。第一次用简书,从今天起在此记录下自己的intenship。
两个月以来学了很多东西。之前在学校只是部署过单节点的Hadoop环境,现在可以用scala coding,使用Spark shell单步调试,打包项目成jar,提交Spark作业。加深了Hadoop和Spark关系的认识。由于所有的操作都在Linux上进行,常用的命令玩的比较熟了。前两天又把正则和lamda表达式复习了一遍。
一些Spark取代Hadoop之类的言论真是耸人听闻,让人哭笑不得。估计是一些门外汉想搞个大新闻。Hadoop是基础,Spark是处理框架,互相依存的嘛。说Spark将渐渐取代Map/Reduce或许还有一定的道理。
实习期间偶尔会有烦躁的时候,一方面是申请的事情还有很多没有结束,另一方面发现自己不懂的东西太多,有时也不好总是问team里面其他人。不过昨晚持续一个小时的轻量级seminar让我收获颇丰,以后需要请教的时候还是得厚下脸皮,毕竟有大牛带和光靠自己啃石头效率肯定不一样。
希望接下来几个月申请顺利,实习顺利。
10.27
今晚完成了留学处女投,Data Science in the University of Edinburgh,不得不说从关注项目信息、准备PS/CV/RL、开成绩单/在读证明、根据项目要求对材料做customization到最后的提交材料,都是对时间和精力的巨大考验。
庆幸没找中介,这些事情交给他们真的不放心,自己认真安排也有能力做好。
看着outlook邮箱里一大堆application过程中来自Edinburgh的邮件,蛮感慨的。希望这些努力能早日换来offer。
对了,要抓紧时间再准备一封recommendation letter了。帝国理工的computing(specialised)以及伦敦大学学院的Computational Statistics and Machine Learning都需要两封RL。
香港这边,HKU和CUHK都只申CS。至于科大,还是等12月的Big Data吧。IT终究是不满意的,申了也没意思。
晚安。
10.28
早上没事逛寄托,问了一个学长自己的背景申IC有没有希望,学长说30%-60%
那就申申吧,就像当时找实习过不了中科院的简历关过不了百度的面试,说不定就中了个IBM了呢。
晚上爸爸打电话过来。说的事情很沉重。希望家里人,尤其是父母,不会有事。祈祷。
10.29
今天周四,是不用上班的一天。早上睡过了错过了和雨旸的早饭,中午在清真食堂吃了香锅后午觉到快三点。起床后给改了改手机开发团队的工作报告发给刘老师,就和远航一起去诚信楼拍毕业证书上要贴的照片。晚饭后写了二十分钟RL,就开始看疯城记,刷了四集后出门接雨旸放学。冻的够呛。回寝室看了几集我是歌手MV,上床。
说实话,真是休息够了。但这生产力,还不如上班。
所以我决定明天上午去上班,继续过地铁上看Machine Learning上班期间学Scala回来写RL读paper的日子。
加油啦少年。希望Edinburgh的offer快快下来。
晚安。
10.30
今天去了公司,原本以为三个月的数据还没准备好,到了十一点半的时候正准备撤退,程泉说数据已经okay了。于是就开始测试之旅,没吃饭没睡午觉,大战到下午三点才把统计报告写出来发出去。
程泉中途叫我去小会议室谈话,简单聊了几句。话说的很委婉,但其实就是想说我不够主动,有时没任务的时候会打酱油。只不过拐弯抹角换了个语气和说法。
程泉的话让我心里不好受,但我相信他也酝酿了很久如何和一个实习生说这样的话。我心里是服气的,为准备申请的事情牵扯精力,一直都没想着尽力吧这份实习做好。常常多一事不如少一事,也不想融入team里。毕竟,打算只在这里呆三四个月,比起学到的东西、比起在这里的人,自己更care的只是这份经历。
下午把工作搞定了回学校,回来的路上我就在想,我这样的思维其实就是一直以来深恶痛绝的“精致的利己主义”。拿到自己想要的了,能在CV里面光荣的写上IBM这样的Big Name了,其他人怎么样就无所谓了。Project能不能做的更好、manager交代的进度能不能按时完成,都与我没关系,反正有正式员工安排。说实话我常常想狠下心这样做,然后全力以赴准备申请,但每次心理斗争都以失败告终。我确实做不了这样的人。或者说,心还是向善的。
如果养成了这样的思维,或许我能赢得一时成就。但投机取巧、不择手段、逃避责任、得过且过将会让我输掉整个品格、信仰、甚至人生。
踏踏实实把每件事做好,这是我对自己在年前的要求。
晚安。
11.9
整整十天没写日记了。
每天基本倒头就睡。睡眠已经变得十分奢侈。
IBM这边coding情况很好,scala用的是越来越觉得顺了。
Research Proposal挣扎了一周,也经历了昨晚选题一下需要有大变动的彷徨,今晚总算基本确定了下来,希望不要再变得太多了。把自己学到的想到的如实表述出来就好,不求多高大上。做研究本该如此。
还有一个月phd申请截止。得抓紧了。
对了,换了MacBook Pro,开发、看文献和写作效率都有大幅提升。很开心。
The best is yet to come.
11.12
今天有点慌。也许明天就是offer的日子。
不过先好好睡觉吧,累了。
11.20
一个星期过去了,offer影子都没见着。
先睡了,明天起来开始进入高效学术状态。
对了,IBM这边要离职了。其实也很想多待一段时间,也很享受写代码的时光。但现在不是能任性的时候,要抓重点。
12.11号前把MscR的申请交上去,然后好好刷听力好好学Machine Learning好好学算法好好学随机过程概率图。是你的都是你的。
The best is yet to come.
11.26
好像从未在早上写过日记。
大早上看了网易云音乐对李健的访谈。对于李健对很多事情的认识抱有认同。
“当没有权力的时候 谈论名利只是个伪命题”
“让虚名虚利离自己远一点”
“只不过我没有被欲望绑架而已。其实人们都在学习如何跟自己相处,如何跟自己的欲望相处,尽量彼此泰然处之,相安无恙。人其实不应该要那么多,很多事情就想想而已,你不能太放纵自己的欲望,什么都想要,这可能是个问题”
“不要再等一个所谓的好时代的到来。因为任何时代,对你来讲都是属于你的时代,它一定不是最好的。但你要等到最好的时代,一切都晚了”
一直比较喜欢李健的原因可能和大多数人不一样。优秀的教育背景、幽默的谈吐、独立思考的精神、英气的面貌、有品位的审美...这都不是最打动我的。我看到的是他的一种孤寂,一种只有优秀的人(或者我认为优秀的人)才有的孤寂。外人如何评价与我无关,今时今日取得什么成就也与我无关,我只近乎偏执得去雕琢我想做的事情。在自己的内心里为自己留三亩地,外人进不来,也不愿展示给旁人看,却有最本真的意念和最朴素的理想。相同的,还有朴树,还有曹方。
做什么事做好都不容易。我觉得清华优秀之处就在于它的学生中的绝大多数最终都会成为优秀的人。除去投行、咨询这种需要学校光环做大量加成的工作,绝大多数情况下,他们的优秀更多是因为强烈的“自我”意识给他们带来的价值信念,带来的异于常人的努力、坚持、忍耐和专注。
清晨自省到此结束,开始写论文。
对了,寒假如果时间允许想自己搭一个Blog。把想post的东西都转移到上面去。
11.28
今天和雨旸“终于”把模型定下来了。打引号的原因是我们每次都是这么想的。
回寝室,开启专注写paper模式,终于写完了估计90%的methodology,剩下一些预处理的两三段话没有写。明天估计能写完预处理,abstract和summary。
今天上午去听粲粲讲了Java基础课,觉得她思路很清晰,代码也比较熟练,应该是没有看错人。作为实验室大四老人发表了几句临别感言,也算是宣告自己大学Android开发生涯的结束。看着团队渐渐走向正轨,心里还是很开心的,也算是问心无愧了。希望这帮小孩能好好加油。
乔布斯说过,every dots in your life will finally connect. 这句话是雨旸告诉我的,我觉得很有道理。如果不是Android开发,完全不知道自己还能把代码写的很溜,发现做一个理工男的乐趣;不会认识刘老师,认认真真把她的课都学好,计算机网络拿了92,软件开发工具拿了97,那个学期的成绩是大学以来均分最高的,当然以后每个学期都更高;成绩不高,根本不可能想出国的事,也许现在就在忙着考研或者找工作了:不会因为刘老师的一句话想转到数据方向,去找了黄浩老师学Hadoop,并且自学Python去写爬虫:如果不是把爬虫的截屏发到微博上,不会认识李兵老师,不会发现自己对自然语言那么感兴趣:如果不是去找黄浩老师学习了Hadoop,自学了Linux,不会有胆量去投IBM的实习生,更不会真的就成了IBM的实习生;如果不是参与到李兵老师的研究中,已经对某一个领域有了超过课本的认识,就不可能理性的选择出国要申请的项目,在大家普遍认为爱丁堡不如G5的时候坚定认为她是我最好的选择,而且相信我们冥冥中有缘分。
这样的联系还有很多,比如在妈妈的要求下去了香港,结果认识了这么有趣的一群人,也看清了自己未来的路,不考虑找工作了;因为可能考虑去香港读书,咨询了余健华学长,虽然现在看来去香港的可能性比较小,但第一次知道了竟然有直博这样的事情,所以我现在在写研究计划…(至于申上申不上…只能说…尽力就好)
睡了。还有两天。还是那句话。
The best is yet to come.
12.1
今天是个值得纪念的日子。Edinburgh的两个offer都来了。认真比较了一下,应该会去读Artificial Intelligence下面的Machine Learning或者Natural Language Processing。
想来还是有点戏剧的。早上在微博上感叹北京雾霾严重,真想早点收offer去苏格兰。晚上给妈妈打电话,说offer应该快要来了,虽然有点急,不过把握比较大。接着就是爱丁堡的QQ群里有人圈我,说他拿到Data Science的offer了,问我有没有拿到。去看了一下,状态确实有点变化。不一会就来了Data Science的offer。正给雨旸打电话报喜的时候,嗖嗖的邮件声告诉我,又有新消息。刷新一下界面,Artificial Intelligence也来了。
于是和雨旸约了12点出去喝了两瓶啤酒,吃了两个蒜蓉粉丝蒸扇贝,一小份牛肉饭。
有感慨,但其实没那么多感慨。有激动,但也没那么多激动。和自己说了那么多次The best is yet to come,也终于实现了一个重要的部分。
接下来的phd申请没几天了。所以依然想轻轻对自己说一句。
The best is yet to come.
12.3
今天去公司把剩下的工作交接清楚了。回来去开了组会,吃了外卖,看了一部叫做「辩护人」的韩国电影。水一水,一晚上就过去了。
明天要认真了。不能懈怠。加油。
12.19
转眼竟然半个多月没写一写了。
曾经有个人和我说,没事别老发什么说说什么朋友圈。当时的我不能理解,一点情绪想法笑话都忍不住掏出来给别人看。后来我明白,感同身受是太难得的事。现在很少说什么,偶尔记录也仅为日后能记住当时的感受。有时会孤独,但谁不是呢。人生而孤独。
2016.1.8
今天是个有特殊意义的日子:ph.d申请被拒。
被拒的很客套:竞争很激烈,不可能每个人都有position。实际意义不难猜出:看不上你,连理由都懒得编了。
一直以为,申上申不上,都无所谓,毕竟这并不是最好的路。甚至,心里还有点希望申不上。可真正到了被拒的时候,又有点失落,那unsuccessful仿佛在告诉我,你还差的很远。
毕竟有一千一万个理由可以用来安慰自己:很多本科CS或者纯数的人在和你竞争;很多985在和你竞争;很多研究生在和你竞争;很多从大一就重视均分的人在和你竞争。
但就是差的很远,没其他。自己最清楚自己,其实我一直都知道的。
老天从没让幸运降临在我身上,也从没让不公降临在我身上。付出了多少,从来就是收获多少,不会错。还记得初中家长会,操场上,当着千百人的面大声发言:
"种瓜得瓜,种豆得豆,种下汗水就一定能收获珍珠"
很多人抱怨收获与付出不成正比。我从没有。这已经很幸运。
还是努力不够多吧。从现在起,好好补基础,好好学未来的课,好好做研究,等变得更强的那天,我希望在康河上看这篇写下的字,告诉自己:
你真正想要的,都是你的。
2.23
快两个月没来写日记了。
今晚算了下办签证需要的保证金,差不多35万RMB。加上又看了篇phd奖学金申请的推文,感受到其中的窘迫,心情有点抑郁。
过年回家,除去一些必要的应酬,没事编编程,和爸妈看看电影,一切都很好。还有五天就要返校了,日子过的真快。
回到学校后,首要大事是解决掉毕业论文。附带的小事还有惹人烦的EA学分,以及一门凑学分的英语课。之后要整理下硕士阶段要学的课程,包括
1. 把现有机器学习的知识学完,并梳理成体系,包括Ng的课,July的课,李航老师的书
2. 把现有Columbia的NLP课程学完,并学习Stanford课程
3. 学完随机过程
4. 同步研究周志华老师的书和PRML
5. 学习Social Analysis的书本
但可能比这更重要的还有一件事,发论文。这包括掌握查阅最新方向论文的方法,并在大量涉猎后形成自己的角度和思路。争取发出一篇AAAI。
有几点希望自己能够做到的:
1. 意识到做研究并不是对自我的放松,做研究应该是清苦的,而不是无人监督的放肆与懒散
2. 提高对自己的意志力,包括严格的作息计划,严格的时间管理,严格的健身计划,和节欲
3. 更加懂事,对父母、恋人更加包容,减少以自我为中心,杜绝把自我的意识强加给他人
4. 懂得接纳不同于自己的生活态度与生活状况,不要求每个人都如自己一样
先这样。晚安。明日起严格执行。
3.5
今天是周六。
回学校整整一周。除了和寝室出去吃了个饭,给远航过了个生日,没其他娱乐活动。一直都在写代码写论文。其实主要是在写代码,论文到现在也才写了不到1/2。
周四下午的时候投了三星中研的简历,做情感计算的。感觉很有含金量。晚上开了组会,讲了一下现在的成果,老师还是很满意的。结束的时候让带着我投个会。我也和老师申请了五月份去Oracle实习。结束之后和雨旸吃了饭,由于她实习的原因,每周在一起吃饭的时间大幅缩减。不过就像当初她等我一样,我等她也是应该的。
吃完送她回寝室的路上,她说其实她觉得我非常厉害。我心里一惊,说为什么。她说,你各方面发展的都特别全面,这很难得。一般一个人能有一个亮点就很不容易了,而你会书法、会改简历、会写代码、会建模、还对自己的研究的领域有很深入的了解。
听完我哈哈一笑,其实还是蛮开心的。虽然我常常觉得自己非常弱,但他人真心的赞美还是会让我看到自己的努力没有白费。它们都真真实实的印刻在了我身上。
周五的中午接到了三星的电面,大致了解了下这个岗位的情况。现在进行的项目主要是做视频和音频的情感计算,而且用的还是深度学习的框架,和我现在的知识技能完全不搭边。但HR还是让我周天的时候技术面,针对一个题目做一个demo。
于是昨晚恶补了下音频处理的知识,但速成这种事情在我身上基本上是不存在的。于是看了些就放弃了。开始转而看phd的信息,结果……又是越看越抑郁。
今早起来在小木虫上学到了如何在学院网站上检索自己方向的导师,于是在爱丁堡和剑桥上都查了查。发现爱丁堡和情感计算相关的只有semantics,而剑桥有distributional semantics。真的是眼前一亮。不过剑桥CS下的NLP组只有四个人,其中Clark教授应该是最契合的了。
下午的时候加上了李博学长的微信。学长爱丁堡Informatics毕业,现在在Mogan Stanley做机器学习相关的工作,当时也是拿到了剑桥的offer但因为奖学金的问题没有去。和他聊了一会,得知他之前也是做情感计算的,而且申的也是Cam的parsing方向。实在是太有缘分。又经一步咨询了投会议的问题,学长建议不要在Tier 2以下,但如果手头没有英文论文的话可以先投个Tier 3的证明下学术能力,因为中文论文老外不认。
我终于知道自己phd是怎么挂掉的了。
聊完后心情又变好了起来,起码明确接下来要做什么了。好好研究一下distributional semantics和深度学习的理论,好好做科研发文章。三星的实习…看缘分吧,不去也罢,毕竟太勉强,多点时间自己支配是件幸事。
加油。我必须很努力。
3.19
又是两个星期过去了。
这两个星期一直在忙毕业论文。看的出老师很想让我拿优秀毕业论文。
很难。但我也想。所以一直到现在还没做完。
一个院一个。这真的是极大的荣誉,也是极大的挑战啊。
好好加油吧。
今晚和负责我phd申请的Yang老师聊了会,被推荐了豆瓣上的COSA君。
经历和我真的是神相似。Edinburgh, Corpus linguistics, Sentiment Analysis,...
随便翻了下他的日志,他也曾感觉SA的路很窄。
果然还是要考虑换方向的事情。
先这样吧,继续去写论文了。
4.10
慢跑了5圈,走了2圈。
4.12
卷腹10套。
跑了5圈(慢4快1),走了2圈。
中饭烤鱼,吃多了。晚饭一块面包、一杯椰子汁、一根香蕉、一小袋坚果。
晚上室友回来很迟,没有影响到我,所以在寝室做PPT,没去牛大碗。
4.13
早上7点多起床,去一食堂吃了卷饼和牛奶粥,碰见李羚,一起吃了早饭。
她考研复旦金融学硕,没成,准备工作。定下来在一个私募。
这么努力的学术型姑娘。造化弄人。
吃完早饭后去牛大碗自习,跑程序加做PPT,一直到中午吃了碗肉末酸豆角炒面,回寝睡午觉。
晚上吃了一份草+一杯八宝粥,去操场跑了5圈(慢3快2),走了2圈。