文献阅读的意义和价值
对于研究生新生而言,刚开学,必不可少的就是接触阅读文献这样一件差事。通过阅读文献,一方面我们可以了解这个领域的专家/学者最近在研究什么,可以从中收获新的insight和知识,另一方面,我们也可以借助这个机会,学习学术论文撰写的方法和讨论,了解写作技术,此外,我们还可以以此来评估今后自己的工作是处于什么level,适合什么层次的会议/期刊。
会议和期刊的区别
首先了解下会议和期刊的主要区别。
会议
一般而言,会议文章审稿周期短,录用速度快,比较直接,部分顶会增加了rebuttal的过程,即有一次审稿人反馈信息,作者对审稿人的问题进行一一辩驳解释,以消除审稿人的疑虑(concerns)。对于会议,除了审稿周期短外,如计算机的会议,要求内容很新,可能会是有新的问题, 也要求有新的方法,尤其是对于做应用(application)的同学而言。
期刊
而期刊,往往审稿周期很长,会反复修改,对内容要求是全文内容全面,推导、实验完整,有较完备的分析和讨论,即“全”。而对新颖的要求会略低于顶级会议。
文献阅读
下面就谈谈如何阅读一篇文献。一般一篇文章分为Abstract、Introduction、Related work、 Methods、Experiments和Conclusion这六个主要部分。
Abstract
当然第一部分是Abstract,这部分是一个工作总览,一般会包含研究的问题what、研究意义价值significance、主要方法 recent works、挑战 still remain challenging due to XX(没解决的问题)、我们提出的框架(we propose xxx to address xxx)、涉及的主要方法(e.g. xxx and then xx, extract the interacted relationship...)、实验结果与结论(Experimental results illustrate xx 提升了多少 outperforms other baselines)
通过读它我们可以快速了解全文的研究内容和主要方法,从而决定这篇文章和自己研究方向的相关程度,确定是否需要花很多时间进行精读,或者依据此也可以确定兴趣程度,来确定如何阅读全文。
Introduction
接着是阅读introduction,我们一般从以下几个方面来对intro进行评估,汲取希望获得的知识(内容):
1.significance(意义)为什么研究
2.motivation (技术)
challenges
3.相关工作 related work 表明自己的与他们其实不同的 problem,method
4.Methods & Main Contribution (Methods 是针对challenges提出的,contributions一般需要从两个方面理解,一个为研究的问题problem,另一个是technique contribution即模型技术上的贡献)
对照主要贡献,当我们自己有了idea的时候,就可以对照这些文章来评估自己的想法处于什么层次level,是否适合这些会议/期刊,哪些是适合我的,我还可以针对哪些方面做哪些提升。
Related work
接下来是阅读related work。
这部分工作的阅读我们需要从中了解到相关工作的写作方法,别人是如何阐述相关工作的,这些工作和我们工作的关联是什么,不同点在哪里,针对本文的contribution,来提别人的工作,并针对性的给出分析,指出研究的不同点和方法的不同点。
Methods
对于Methods方法部分,我们需要着重把握文章提出的模型是什么
对于一般的机器学习模型,可以拆分为模型和数据两个大块。
数据:输入是什么(features) 输出是什么 y, prediction
模型:模型框架即结构是什么(structure)
模型的损失函数如何设计(定义)loss function 是否有正则化
这个模型和别人以往工作的模型创新点在哪里,是基于什么motivation的,即基于某个observation(什么样的规律或者观测或者发现,在这个发现的基础上,我们对过往的模型提出了改进)
Experiments
对于这一部分,我们一般需要关注作者是如何设计这个实验的,如何控制变量,这些实验设计出来的目的是什么,即为了验证什么。
如模型本身准确率很高?
某一单个模块很有效? 尤其是自己提出的方法 设计的模块 更应当验证其有效性
是否有做消融实验?
实验结果的分析:
是怎么去表达数据的不同(变化)的,如何表达好的,如何规避“不太好”的实验结果。
一般需要纵向比(即和不同的模型比,我们的模型总体上都比其他同类或不同类的模型效果都要好一些)
一般还需要横向比(即和自己比,做消融实验,消去自己模型的不同模块 评估准确率,为了得到不同模块都是对结果优化起正面作用的)
Conclusion
这一部分往往会阐述(回顾)本文的研究问题和主要方法,进一步的提出未来工作展望。可能部分文章(尤其是期刊)会增加“讨论”这一部分,让读者明白其模型其设计的motivation及其设计的小弊端、小缺陷(这样做的好处是承认问题 避免审稿人再挑刺)。
这部分可以学习到结论部分是如何重复阐述问题(和abstract类似而又表达语句不同的)怎么指未来的研究方向。以及什么样的小弊端是可以在论文最后提,而有些弊端是不用提的,避免麻烦。
实时记录好的句子和想法
以上就是初学者阅读论文的主要思路和方法,并且在阅读过程中,遇到好的表达方式可以进行记录,并标记这种表达一般用在什么地方,方便今后写作时调取进行模仿写作。
略读
在阅读完一定量的论文具有了一定积累后,可以试着粗略阅读,比如我们只是想看看方法和技巧,那么我们可以快速阅读摘要,模型的框架(Framework)从而可以看到模型的主要贡献在哪里,通过扫描实验可以大致看到实验的设计和主要结果。