对自然语言处理领域贡献最大的两个人,除了之前提到的贾里尼克之外,还有一个就是将这种研究方法发扬光大的米奇.马库斯。和贾里尼克不同,马库斯对这个领域的贡献不是通过直接的发明,而是通过他建立的宾夕法尼亚大学LDC语料库以及他教出了众多的杰出弟子。
语料库LDC是为所有自然语言开发者提供了统一标准的素材,通俗的说,就是自然语言研究的大数据,至今仍在不断丰富。随着语料库的越来越精细全面,建立在之上的语音识别和语言处理也越来越成熟,相当于为整个领域提供了最基础的发展土壤。
另一个重要的贡献,就是作为老师,教出了一帮牛人弟子。(有点类似日本围棋界的木谷实,他带出了石田芳夫、加藤正夫、小林光一、武宫正树等,师徒们统治日本棋坛多年)他作为宾夕法尼亚大学计算机系的主任,在教学育人的成就远远超过了他的专业技术上贡献。同时,宾大计算机系成了全美大学的最顶尖学科,门下弟子遍布科研和企业,成了各自所在“帮派“”的掌门。
马库斯的弟子性格各异,学术风格也迥然。其中有代表性的两位是柯林斯和布莱尔。
柯林斯是追求完美的典型,在他研究的领域,他习惯将研究做到极致。精耕细作花费大量时间将每个细节打磨到极致,最终的论文成果无一是业界经典,获奖无数。
布莱尔则是另一种风格,追求简单有效的方法。他往往善于将复杂的问题用最简洁的方法快速实现,而且不断的寻找更简单的方法,更快捷实用。
两个人的研究风格也与他们后来的事业路线吻合:马库斯成了哥伦比亚大学的特聘教授,而布莱尔则转战企业,在最顶尖的Google、微软等公司任要职。可见,大学更适合从学术上将问题琢磨到极致,而企业则更追求简单效率。
当然,现在国家提倡的“工匠精神”,本质上也是在追求完美和极致,在传统领域上尤其如此。而在新兴的互联网和人工智能领域,速度就成决定企业能否脱颖而出的关键,跑得快才能活下来。
对于企业而言,如果同时拥有这两类人才,就成了幸福的烦恼,如何发挥两类人才各自特点,往往能看出管理者的水平。