本文唯一作者为Bright新人类,如需转载,请先发简信通知谢谢
在上一篇文章中,我主要介绍了些我非常喜欢的APP。这些APP呢不仅设计感强,而且极大地提高了我日常工作的效率,如果你也感觉不错,不妨一试!
在这篇文章中,我会详细讲下我是如何阅读一篇文献的。阅读文献是一个科研工作者跟踪任何领域科研进展,挖掘未来科研方向的必备方法。良好的文献阅读习惯能让你在最短的时间内阅读最多的文章,并抓住各篇文章的重点。所以在正式开始博士生涯之前(甚至在申请博士的过程中),你一定要建立适合自己的文献阅读方法,这样你在找research topic的时候,才能事半功倍。
这里首先强调下,本文介绍的文献阅读方法,是我自己在阅读文献时总结的,不一定适合所有的硕博生和博士申请者,也不一定适合计算机科学外其他专业的同学。我希望的是,通过阅读这篇文章,你能够反思下自己阅读文献的方法和步骤,微调一些可能导致阅读效率不高的细节,最终形成专属于自己的一套阅读文献的方法。
不多说了,拿起Paper,让我们一起搞事情~
1. 一篇Paper由哪些部分组成?
总的来说,一篇文章主要包含以下这些部分:
1. Title
2. Key Words
3. Abstract
4. Introduction
5. Related Work
6. Model Description
7. Experiment (including results and discussions)
8. Summary & Conclusions
9. Reference
不同的会议,期刊可能会有不同的要求,但总体来说任何一篇文章都应该包含以上这些部分。那么面对一篇短则9-10页,多则10多20页甚至更长的论文,我们如何在最短的时间内抓住该文的中心,提取最有利于我们当前研究的资料呢?我们就要掌握阅读文献的策略了。
2. 阅读Paper的整体策略
在阅读文献前,你要明确的有两点:
1. 你当前的科研方向是什么
2. 你当前研究的兴趣点是什么
首先你肯定要把你的精力放在和你科研方向最相关领域的论文上。比如你的研究方向是文本挖掘,那花很多时间去读Computer Vision的论文肯定是在浪费时间的(当然如果你将来的研究方向是NLP和CV的结合领域如VQA除外)。
另外,在很多和自己研究相关的文章中,你一定要挑选自己最感兴趣的论文进行阅读。一个好的方式是你能对自己说出来:这篇文章吸引我的点在哪儿?比如说这篇文章的模型非常新颖,亦或者这篇文章把两个原来看似不太相关的topics联系了起来等等。这种被阅读兴趣驱使的感觉能让你在读论文的时候更容易钻进去,能够更好地吸收论文的精华。
那么明确了这两点之后,假如我找到了一篇和我研究课题非常相关,并且我也非常喜欢的文章:
那么我该如何去读呢?这里面可是有大学问的哦~
3. 阅读Paper的顺序及各个部分的阅读方法
关于阅读论文,首先我们应该清除一个误区,就是很多同学拿到一篇文章,就要从头读到尾,一个字一个字地看,这是严重错误的。且先不说这样看的效率有多低,很多同学这样看完后,过了两三天,你如果再问他那篇文章讲了什么?很多都答不上来。为什么呢?因为当你从头到尾去读一篇文章的时候,你等于把自己读这篇文章的时间平均分配到了该文章的所有部分上,这显然是错误的。因为更合理的方法显然是把绝大部分的时间分配到这篇文章的重点内容上,这样你才能有提高和收获。
那么我们应该如何正确阅读一篇论文呢?我个人的理解是应该基于上文中提到的论文的那九个部分,以及随着阅读的深入你对这篇文章是否还有兴趣进行阅读。下面我就以2018年发表在AAAI的一篇文章:
为例讲下我是如何看一篇文章的。
在这里请注意,如果你按照我下面提到的这个步骤进行阅读,那么每完成一个步骤,都要再次问自己:我对这篇文章还是否感兴趣?如果读着读着感觉没什么新意,尽管跳过这篇文章,去找和你研究方向更相关,更让你感兴趣的文章去读!
3.1 See the Big Picture (Title + Keywords)
文章的标题和关键词是对这篇文章最凝练的概括。通过快速阅读标题和关键词,你可以大致了解文章的内容,并且判断你对这篇文章感兴趣的程度:
通过看标题,你就能马上知道这篇文章是关于Representation learning, Reinforcement learning的在一个自然语言处理的task(text classification)上的应用。如果你目前的研究方向跟NLP啊,强化学习啊特别是与这两个领域的交集部分有关的话,不妨就可以深入读下这篇文章~
3.2 Sip the Tea (Abstract + Name of Each Section + Graph + Conclusion)
如果看完标题和关键词,你对这篇文章的内容很感兴趣,那就不妨开始读一些实质性的内容吧!Abstract是对一篇文章非常精炼的概括:
最开始读Abstract的时候,你要尝试了解以下问题:
1. 这篇文章要解决什么问题?
2. 它要提出什么样的模型?这个模型跟之前的模型比有什么区别?
通过回答这几个问题,你就会对这篇文章产生一个整体的印象,即Big Picture。读完Abstact以后,快速扫一下全文的内容,看看每一部分的标题,同时重点关注一下论文中的插图。俗话说一图胜千言,有时候很简单的一张图,就把这篇文章提出来的两个模型阐述的一清二楚:
通过看图,我们就能很快看出ID-LSTM model的目标其实就是利用强化模型返回过来的reward去删除句子中不重要的词;而HS-LSTM model呢,则能发现句子中的phrases,最后一个句子的表示呢就可以通过Word-level representation和Phrase-level representation共同表示出来。按照这样的方法一直读下去,直到Conclusion部分:
当你阅读Conclusion部分的时候,你要重点关注以下问题:
1. 再回顾下这篇文章的大致内容?
2. Future research plan?
结尾部分往往非常具有启发性,特别是future work或许能给你自己的研究带来一定的指导。
这一遍过的时候,没必要纠结论文中的细节,如具体的模型表述,公式推导,算法等等,那是我们如果到最后一步的时候才需要做的事情~
3.3 Just Move On (Introduction + Related Work)
如果按照3.1和3.2的方法看完,你对这篇文章还是非常感兴趣,这时候就可以开始深入读这篇文章了。论文的Introduction部分属于正文的第一部分,在看introduction的时候,你需要留意下面这些内容:
1. 关于文章中提到的问题,之前的研究中有哪些有代表性的做法?
2. 本文提出的模型具体有什么特点?这篇文章的贡献有什么?
Related Work有的文章有这个部分,有的文章则把Related Work融到Introduction里面说了。如果想深入了解该研究领域的发展简史,可以多留意下这部分,在这里不再赘述。
3.4 Grasp the Knowledge (Model Description + Experiment)
Model Description和Experiment部分是所有论文的核心,是作者展现自己模型表现的环节,也往往是一篇文章最难啃的部分。如果这篇论文和你的研究方向非常相关,对你将来的研究有非常大的指导意义,这时候就没啥可说的了,数学模型啊算法啊代码啊这些都不要漏,好好啃就行😄
有时候自己啃起来会比较乏味,不妨邀请别人和你一块儿啃😄。原来看起来非常困难,想不通的问题,可能大家互相讨论下就能出来了。网上如Quora,知乎等论坛有很多大神,直接发出清楚礼貌的提问并且邀请他们回答,有时能给你意外的惊喜。
还有最后就是可以把论文打印下来,没事就翻翻,有时候科研的灵感就是这么出现的。
4. 总结
在这篇文章中,我详细介绍了我是如何阅读一篇文献的,科研新手可以稍微借鉴一下,老司机的话不妨在评论区写下自己阅读论文的方法,好东西就要拿出来跟大家分享嘛!
当你阅读了很多篇论文以后,电脑里肯定存了很多XXX.pdf的文件。很多朋友看了很多篇文章,但是总是看了现在的忘了以前的,之前看过的文章就像是过眼云烟,没有在你的知识库里留下任何痕迹。在下篇文章中,我会分享下我是如何管理自己看过的文章的,更具体地说就是如何把它们进行合理的归类。
最后再打个广告,这几天有很多小伙伴关注了我的海外博士申请专栏,但是呢那个专栏基本已经完成了它的使命,为了保证内容的整体性和纯粹性,往后是不会有新的文章加入进去了。喜欢我写的内容的话还请关注我,后面会有更多精彩的文章放出,敬请期待!
最后祝大家科研顺利!