最近参加了tiger组织的解密大数据学习群,他请了几位数据科学家方面大牛来做分享,从牛人的经历来看,我们普通人和他们还有多大的差距,如何才能成为一个数据科学家?
一、什么是数据科学家
根据IBM研究院的这张图,数据科学需要这三方面的知识 Math and statistics(数学与统计),Computer Science(计算机科学),Domain Knowledge(行业知识)。
二、和数据科学家的差距在哪里
如果以上面这张图为例,衡量与数据科学家的差距,就转换成掌握这些知识的多少。根据tiger等人的学历和工作背景,初步估算了一下几位大牛的情况,100%是最高,结果如下:
tiger等人都是北美高校的统计学博士,显然数学和统计学知识是非常强的,例如像蒲博士那样的,在读博士期间又修了很多计算机编程方面的课程,计算机知识也还是不错,当然行业知识会弱一些。自己和他们相比,差距还是非常大,主要是受到自己的学习背景所限,数学、统计和计算机科学学习都很少,稍微好一点的是,自己在金融行业,每天做的工作会逐渐增加自己的专业知识。
三、可行的成长之路
目标已经明确,具体的路径如何选择呢?
路径的选择由自己的起点决定。
第一类,统计学或者理科背景,路径是补上计算机知识,尽快从事数据分析工作。以tiger他们为例,他们都是北美著名高校的理科博士或者统计学博士,起点还是非常高的,短板是计算机科学和行业知识,他们的最佳路径就是在博士期间补强计算机知识,然后利用暑期实习等机会增加行业知识,一旦进入互联网行业或者在金融等行业从事数据分析工作,他们原有的统计学背景结合计算机专业知识,就能够迅速发挥作用。
第二类,计算机背景,建议的路径是凭借计算机能力进入互联网或者相关行业,增加统计知识后通过从事数据分析工作来向数据科学家的方向发展。
第三类,传统行业背景,建议的路径是以现有行业为基础,挖掘可以开展数据分析的具体领域,在应用的过程中学习和掌握统计、计算机知识,逐渐提升自己的数据分析能力。在组织内部,也有机会调动IT等方面的资源,有些工作不一定需要自己亲历亲为,但是数据分析的基本逻辑还是要非常熟悉。
PS:关于几位数据科学家的具体介绍:
硅谷数据科学家成长之路主讲人介绍 蒲博士,统计学博士2007年-2011年在上海交大读核工程专业2011年-2013年在明尼苏达大学读物理专业2013年-2017年在加州大学圣地亚哥分校读统计学专业