转眼间一个月过去了,自己也在深度工作的状态下坚持了一个月,这一个月的我是孤单的,也是充实的。
1.paper reading
在感觉自己在专业方面的底蕴薄弱之后,自己下定决心读一些曾经认为离自己很远又很有高度的文章。
从AlexNet文章开始,在图像分类这一块,看了VggNet、GoogLeNet、ResNet、NetWork in NetWork五篇文章。基于这些文章,我懂得了原理DCNN不仅只有卷积、池化、激活和全连接,懂得了大牛们在提升网络结构和优化网络性能方面做的那些努力。
在物体检测这一方面,从将CNN提取物体特征后用于物体检测的开山之作RCNN开始,到Fast-RCNN、Faster-RCNN的一系列姊妹篇,还有end-to-end训练得YOLO实时检测网络,从这些文章里,我看到了算法的魅力,从算法里我理解了fantastic这个词的真正含义,从原始的RCNN训练及验证耗费巨大到YOLO网络的物体实时检测,我突然感觉到了原来阅读paper的感觉一切都是那么美妙。此外,除了以上的paper,物体检测领域还有一些paper值得探索:YOLO2,SSD,Mask-RCNN,何恺明大神凭借后者拿下了ICCV的best paper。
在图像分割这一方面,FCN是将深度学习运用到图像分割领域的开山之作,图像分割其实也是预测,差别就是分类预测是基于单一物体的single prediction,而图像分割则是Dense prediction。要达到较好的效果,就需要处理好边缘信息、像素的上下文信息、多尺寸信息等,随后基于处理好这些信息的各类思想就被大神们脑洞打开的创作了出来,在这个过程中,终于有勇气去挑战让自己讳莫如深的RNN、LSTM网络,这才发现,原来曾经让自己害怕的东西竟然可以只用2个小时掌握它的精髓(扯远了)。在这些paper中,自己研究了DeepLab v1,DeepLab v2和DeepLab v3 paper,并在各类的博客中,发现原理还可以有空洞卷积这种神奇的东西,并且通过这个原理可以随意控制感受野的大小,也可以使得特征的分辨率不会随着卷积、pool的增加而减少。此外,DeepLab v2帮我打开了概率图模型的知识大门。此外,我所知道的图像分割的paper还有 CRFasRNN,RegNet等等,并且网上都有很详细的资料,但一定要耐着性子去看。
2.项目实战
跑过并在调试中一步一步跟踪过YOLO模型的具体实现,在调试中掌握了python的面向对象的编程思想,更重要的是明白了卷积的深一层的含义。此外还有一些小收获,包括TensoFlow搭建项目的技巧,fine-tune、transfer-learning等。在未来一个月中,将实现DeepLab v2和v3+的项目实战,凭借前者的项目实战要一定程度上掌握概率图模型,通过后者的实战,要掌握xception的设计技巧。
3.生活
深度工作以前的我,每周看上去忙忙碌碌,但当新的周一来临时,好似什么都未曾改变,这种感觉让自己很不踏实,深度工作以后,自己每完成一个东西就往脑子里装了东西进去,而且做完事情以后直观上就有时间和心情去看电影、逛街、吃东西,不会感觉总活在忙忙碌碌中。
4.同学情谊
时光荏苒,转眼留给自己在学校的时间就只剩2~3个月了,我喜欢周围的人,喜欢这个学校,喜欢和老铁瞎扯淡,喜欢和师弟师妹吹牛,喜欢司机的真诚,喜欢这里的一切。但念旧的我更喜欢外面的大千世界,更喜欢离小仙女更近的魔都,这是我选择的另外一条孤独、怀疑但只能相信自己的路。
深度工作让我的生活单调却不乏味,唯一不美的就是这个月没看书,没写书评,没写影评
2018.04.01 1/4的2018过去了,继续加油~