本文唯一作者为Bright新人类,如需转载,请先发简信通知谢谢
在上一篇文章中,我主要聊了下我是如何阅读一篇文献的。希望你读完后,能够取其精华去其糟粕,深刻反思下自己阅读文献的方法,形成专属于自己的阅读文献的套路。
但是现实情况是,当你想要了解一个领域的最新进展时,读一篇文献是远远不够的,你要大量阅读该领域顶级期刊/会议的最新文章。这样一来,你一定会下载很多XXX.pdf的文件:
那么如何管理这些文献呢?我发现很多小伙伴阅读文献的痛点就是:我最近在研究XXX,我看了好多篇文章了已经,但是忘了又看看了又忘,翻出来之前看的一篇文章却都不知道在讲什么,感觉什么也没记住。很显然,如果你出现这种情况,那肯定是你文献管理的方法有问题。
那么究竟如何管理自己之前看的文献呢?下面我就介绍下我管理文献的方法。在这篇文章中,我会使用Mendeley和XMind管理我的文献库,这两个软件在我之前的文章那些超赞的APP,强烈推荐!中也有介绍,喜欢的朋友可以下载下来用用。
文献管理的方法肯定多种多样,本文只是呈现了我个人的一些浅见,仅供参考😄。
1. 文献管理的目标
首先需要明确的是,我们文献管理的目标是什么?Or in other words, 什么样的文献管理方法才是好的方法?我认为主要有以下几点:
1.1 能够在最短时间内抓住文章的核心内容
当你需要回顾之前阅读过的一篇文章的时候,如果从头到尾再读一遍,那效率就太低了。即使用我在怎样阅读一篇文献?中的方法,你还是需要相当长的一段时间来抓住文章的重点。那么怎样才能尽快把握住文章的要点呢?
答案就是Read Notes。请注意这里的Notes不光指的是自己写的对文章内容的一些概括,还包括你设置的一些分类呀,标签呀等等一切关于这篇文章的有用的信息。在Mendeley中,你可以设置不同的文件夹对自己的文章进行归类。同时针对每一篇文章,你还可以设置tags, author keywords以及notes:
具体如何使用这些功能把握文章内容我将在下一节进行详细地阐述。
1.2 能够把握各篇重要文章之间的联系
当你使用1.1中的方法对每篇文章进行标注以后,我认为你还需要work out跟你研究非常相关,很重要的文章之间的联系,或者你需要建立这些文章背后各个知识点之间的联系。因为这样,你才能把握该研究领域的进展以及主要思想,对你巩固之前的工作,发掘新的研究点具有非常重要的意义。
那么这时候XMind的思维导图就派上用场了!
它的强大已经无须赘述,利用这个软件能帮你建立各个文章之间的联系,了解一个研究领域的发展历程,以及Brainstorm出新的研究点。具体如何构建思维导图我也会在下一节中进行阐述。
2. 如何管理文献?
那么到底如何管理文献呢?结合第一部分讲到的两个目标,我就在这里讲讲我的方法。
2.1 标注文献
标注文献是为了不用翻开文献就能快速了解文章内容。在Mendeley中,我们就可以根据自己设置的文件夹名,tags,keywords,notes知晓文章的大致内容。具体步骤如下:
2.1.1 根据主题创建文件夹
首先面对自己一开始杂乱无章的文献库,尝试着根据主题利用Mendeley将他们进行分类:
你可以根据文章的重要性以及课题跟自己当前研究的相关性将这些文件夹进行排序。比如今年自然语言处理中预训练的语言模型火起来了,而且你非常感兴趣,你就可以把相关的文章放在这个文件夹,并把该文件夹置于首位。接着你就可以按照重要性和相关性将文件夹排序了。
在这里我的建议是不管你研究的是什么方向,设置Survey和Others这两个文件夹,分别用来保存综述文章和其他跟自己方向弱相关,但是idea不错的文章。综述文章不仅能够帮你理清该领域的发展历程以及重要成果,还会给出将来研究的指导,往往是非常不多的资源;其他文章虽然可能目前跟你的研究领域有一定差距,但是你可以粗略掌握下这些文章的idea,说不定以后就能用到。
2.1.2 设置Tags和Keywords
在创建好文件夹后,你还可以给每篇文章加上tags和keywords。这样不仅能让你快速了解文章的研究领域:
你还可以利用Mendeley的过滤功能快速定位具有相同tags或者keywords的文章:
何乐而不为呢?
2.1.3 写General Notes
最后,你还可以通过自己写关于这篇文章整体内容的笔记加深对这篇文章的总体印象。在Mendeley中,你可以通过General Notes撰写自己对这篇文章的总体看法:
通过上面这三个步骤,你对一篇文章的处理可以说完成了。下次即使不让你点开这篇文章,相信通过看上面这几个部分,你对这篇文章的内容基本能回顾个大概了(如果需要彻底回顾文章的技术细节当然是要点开文章看的)。
下面我再讲讲如何把这些文章联系起来。
2.2 关联文章
在完成文献的标注后,接下来我们就要把文章关联起来啦!在这里我就以自然语言处理中的Language Model为例建立如下的思维导图:
在你建立思维导图的时候,建议从最上层最笼统的概念开始(language model),根据自己阅读的文献,不断创建新的分支。所以在你阅读文章的时候,一定要弄明白这篇文章的创新点在哪里。有的文章属于模型上的创新,还有的文章借鉴了别的领域的研究思路,在模型训练的strategy上进行了创新。根据这些角度的不同,你就可以发展出更多的叶子节点去概括之前的研究工作。
但是有时,随着阅读的深入,你可能也会发现之前的子树有误分的情况,亦或者好几片叶子其实可以概括成一类。这时,利用Mendeley可以非常方便的进行修改,同时附上自己喜欢的文章并写下相应的标注。这些功能都能让你更好的把握当前领域的发展态势,并且在将来帮助你开发新的研究点,即这棵文献树上新的叶子节点,到了那时,你就是这个细分领域的专家了😄。
3. 总结
在这篇文章中,我分享了我是如何管理自己的文献库的。开始时管理这些文章会花掉你很长的时间,但是如果你习惯了这个流程,会发现它能给你带来很多惊喜和收获!
阅读文献是我们跟踪某个研究领域最新进展的不二法门。当我们已经读完手中的文献或者需要新的idea的时候,我们就需要新的文章去充实自己的文献树了。那么怎么获取新的,高质量的文章呢?那就逃不掉几乎全世界所有科研人员都会用的搜索引擎:
在下篇文章中,我就好好分享下如何查找高质量的文献,如何灵活运用Google Scholar的搜索栏以及如何通过Google Scholar建立自己研究领域的bibliography。
那我们下篇文章见😄!