最近有位读者给我留言说:
吴老师,我们定您的专栏大部分都是研究生,想请问您写论文的窍门?
我猜想他现在面临研究生毕业写论文的难题了,因此把问题提出来。这个问题带有普遍性,因此我不妨把我的经验告诉大家。不过在讲怎么写论文之前,先要说两件事。
首先是对这个留言本身作一个评论。这位读者找到了很多人的痛点,就是在书面表达中所遇到的困难。不过,我这个专栏的读者中,是否像他所说的那样大部分订阅的人是研究生,我颇为怀疑,因为从大家的留言来看不是这样的,因此这个说法可能是信口开河,这是写论文的大忌。
这短短的一句话暴露出的第二个问题,就是什么场合要用什么语言,不能混着来。通常在社交网络上发布评论时,语言不需要太考究,大家都知道是随感而发,对于错别字和病句也不会太在意。但是,如果向对方提出一些请求,句子就要注意了,不能出现错别字和病句,像上面这句话就是病句。
通常,被请求的人是否回应请求,什么时候回应,就完全看他高兴不高兴了,对于词不达意的问题,被请求的人可能就把它扔一边了。此外,即便是比较正式的书面语、论文、商业信函、法律文件,用的语言也是完全不同的。我们说讲话要看人,其实写东西也要看场景。
其次是关于今天的标题,我原来起的是“写论文的诀窍”,因为今天谈论的内容其实可以覆盖到非科技的论文,比如历史学论文或者政治学的论文,但是后来想想,还是加上一个限定的形容词比较好,这样可能会失去一些读者,但是不至于让读了的人失望。
在讲怎么写论文之前,先说一个现象,为什么中国科学家在世界一流杂志和会议发表论文比较难?是研究水平不够,还是不会写论文?研究水平不够当然无法发表,但很多时候中国学者的很多论文本身写得也大有问题。
其实我自己在 2002 年到 Google 之后写研究性的论文并不多,偶尔写也是综述类的,写综述类的论文和写研究性论文不同,前者大家很少写,我就不在这里浪费篇幅讲了,后者可能是很多人一辈子要遇到几次的问题。
我从 2000 年前后开始,断断续续地给我所在领域的一些顶级杂志和主要会议审稿,也担任过一些重要会议的程序委员会成员和负责人,因此虽然我写得少了,但是依然知道大家是怎么写的,而且这几年论文的写法并没有什么变化。我想,对什么样的稿子容易被录取,我还是有点发言权的。
每年,也有一些国内的学者请我帮助修改他们即将投稿的论文。这么些年看下来,审下来,一方面我不得不说国内一些学者的论文写得不符合规范,以至于他们虽然有很好的研究成果,但论文被拒绝了;另一方面,国内一流大学的年轻学者写论文的水平进步很快。因此,写论文是很容易进步的。
写论文首先要搞清楚写什么,哪些需要写,哪些不需要。国内一些学者写论文的第一个通病是写了一堆没有用,甚至有副作用的东西,这主要表现在:
过分强调自己研究的重要性,上升到非常高的高度,生怕立意不够高被拒绝。其实不仅是写论文,申请经费写报告时也是如此。很多国内学者向国家各种基金委员会申请经费时,喜欢夸大,动不动就讲如果国家不支持我的研究,这个社会就会无法运转了。
在吹完牛皮后,接下来这些学者会自顾自地讲自己的方法怎么好,然后在不提供细节的情况下给出一些难以对比的实验结果(比如使用自己设计的数据,而不是学术界一致采用的),最后宣布自己解决了一个天大的难题。
其实,论文中那些大话,比如某一项研究怎么能够改变世界,等等,即便是真的也都是废话,因为在学术圈子里,同行对这项研究的背景和意义都比较了解,无需费太多口舌,不需要像新闻稿那样一定要上升到什么高度。至于发明和发现是否那么重要,一切看结果就可以知道了。那些大话、废话,除了占用宝贵的篇幅,对论文的录取没有帮助,甚至只有副作用。
知道该写什么之后,然后的问题才是要了解“那些被录取的论文通常是怎么写的”,这其实和科学方法本身的特点有很大关系。
今天的学术研究,99% 是 N+1 的工作,不管你怎么吹它的重要性,还是 N+1,也就是说你发现前人的工作可以有改进之处,你把这个问题解决了,这本身就足够有意义。既然是 N+1 的工作,任何人写论文时第一件事情就是要提一下 N 的工作,也就是同行们以前做过的工作,当然,也要指出前人哪些工作没有完成,这既说明你研究的必要性,也是对前人和同行的认可,这部分文字是不能省略的。国内很多人搞科研,不做详细的文献研究(literature study),上来就谈自己的工作,这种论文给人的第一印象就不好。
在介绍完别人的工作,或者说自己的工作基础后,才能开始介绍自己的工作。这部分是论文的主要部分,需要注意三个细节。
1. 自己的工作想得到什么样的结论,这是论文的灵魂。
2. 为了得到这些结论,自己的工作是怎么做的,这个过程要写清楚,但不要啰嗦。对于人文学科的论文,需要在文献和其他数据中寻找证据。证据要能支持自己的假设,内在的逻辑要成立。对于自然科学的论文,不仅要有实验结果,而且实验的设置要合理,实验条件要符合规范,不能乱来。
3.论文的结论应该是前提假设和研究工作的自然结果。很多糟糕的论文,从他们的前提和工作中,得不到他们想说的结论。
好的研究论文,不仅要得到自己的结论,还需要比较自己工作和相关工作的优劣。既然做学问是 N+1 的工作,我们为了证明 N+1 比原来的 N 要好,你首先要重复前面 N 个人的工作,这也是为什么在科研上实验结果必须能够重复的原因。
一个有经验的导师,指导博士生做研究时,通常是从重复前人的实验开始的,然后才开始自己的改进。将来写成论文时,实验结果的第一部分就是重复前人最成功的实验(一般被称为基准,Baseline)。然后,才是对自己各种实验结果的介绍,以及和前人的比较。
可比性对科学研究非常重要。为了让大家有一个可以公平比较的平台,各个学科领域都有很多共享的数据、材料,和工具,供同行们使用。这些是属于整个学术圈子的财富,它们有些是各个实验室贡献出来的,有些是政府基金专门建设的。大家做研究都要用这些共同的东西来验证、比较,这样才是橘子和橘子的比较,而不是拿苹果和橘子相比。
对于非自然科学的论文,使用的数据一定要是同行也能够得到的,比如在经济学上,大家常常采用世界银行、美国中央情报局、美国统计局的数据。我在写《浪潮之巅》分析各公司经营状况时,一般都引用它们向美国证监会(SEC)提供的数据,而不是《华尔街日报》的二手数据。
在学术界,为了便于大家进行学术交流,常常要建设一个给学术圈子使用的基准平台,有些时候这是要花很多钱的。2015 年 Google 为了让全世界的大数据医疗研究有一个可以做对比实验的基准,拿出 1 亿美元给了斯坦福和杜克两所大学的医学院,用 5 年时间采样 5000 人(各 2500 人)的全部生理和医疗数据,作为将来全世界在相关领域中搞研究的共同基础(这个项目被称为 Baseline,基准)。这样一来,当一个研究小组发表实验结果时,其它研究单位很容易用相同的数据验证实验结果是否可以重复。
如果一个研究人员在前人的基础上更进一步,那是一件可喜可贺的事情。但是,完成了 N+1,将来就会有 N+2,因此好的论文最后都会从学术的角度,讲一下自己未完成的工作,这些工作或许是自己正在进行的,或许是留给同行的。到此,一篇论文才算完整。
从这个写作过程可以看出,它似乎就是一篇中规中矩的八股文。是的,学术界对规矩是非常看重的,一旦守规矩,写出来的必然就是八股文。能够按照上述的条条框框写出一篇八股文,至少是符合要求了。论文不同于散文,它的结构远比文字重要,结构不对,文字再优美也没有用途。
在结构之后,论文还要注意的是用语。写论文是一件严肃的事情,要采用严格的书面语。在美国,写论文有四个动词不到万不得已是不能使用的,它们是“ be ”(是),do(做),have(有)和 make(制作),因为它们含义的外延太广泛,不准确。很多中国人写的英语论文里面特别爱用这四个词,读起来就是中国式英语,不仅枯燥,而且意思表达不准确。
在做到达意准确之后,如果想做得更好一点,才需要考虑文笔优美,那是锦上添花的事情,如果做不到,对于论文也没有太大关系。
写论文还要注意两个细节。一个是凡是别人的数据和观点都要给出出处,二是对于任何在做研究和写论文过程中给予帮助的人,都要鸣谢。到此,一篇完整的论文就完成了。
虽然今天聊的是写论文,也希望这些内容对你的工作有所启发。