Pooja Ramesh 两年前辞去了她在Intel公司的工程师工作,随后结婚并搬到了Denver,在这之后她花了一些时间去寻找一份新的工作。
事实上,她在去年秋天花十二个星期进行了数据科学家的职业培训,而这份职业现在已经成为 2016 年最热门的职业之一。
“一切都很顺利”,Ramesh 说道。她曾经兼职为 Galvanize 公司的数据科学项目工作,这些项目探究如何使用数据科学更快速地探测到乳腺癌。
“我当时负责进行统计分析,但是我并不知道它原来可以归类到数据科学中。直到去年秋天我参加了培训,我才意识到我曾经做的就是数据科学家的工作。”
数据科学家是传统的例如数据分析师、经济学家、统计学家、计算机科学家等职业的奇妙融合,它被 Glassdoor 网站评为美国 2016 年最好的工作。
但它远远不止是收集数据和分析数据。它是为了那些拥有好奇心、那些具有直觉的和不仅仅只是想要解决问题而是想要打破砂锅问到底的人所准备的工作。它是科学与艺术的交融。
数据科学的崛起要归功于数据采集数量的爆炸式增长——也就是我们常说的大数据,也要归功于公司对于掌握新数据类型的需要,这种新数据类型是来自于手机、图像、人类行为甚至是手写笔迹的数据的混合体。
“时代发展至今,所有的公司都具有了网络上的实体,因此它们都需要一些了解如何管理和存储数据的人才,从而帮助他们更好地做出商业决策”,Glassdoor 网站的首席经济学家 Andrew Chamberlain 这样说道。“数据科学家成为最热门的工作并不奇怪,因为它是我们现在看到的最火热和发展最快的工作之一。”
这种工作类型已经以某种形式存在许多年了,Masum Muttalib 说道,他所管理的团队中有超过二十位数据科学家,他们都工作于 Broomfield 的 Level 3 Communication 公司。
“数据科学确实是这段时间非常流行的词汇,但是其中所使用的方法和工具已经出现有一段时间了”,Level 3 Communication 公司负责微观经济及运筹学的负责人 Muttalib 说道,“数据科学早在本世纪初期就已经在第三等级中被使用了。”
他指出,更加便宜和快速的电脑的出现、许多开源的工具及软件的使用极大地推动了这一工作的迅速流行。
“日益普遍且成本不断降低的数据科学使得我们可以回答更多在以前看起来过于复杂的问题”,Muttalib 说道,“现阶段可用的专业领域知识和进行一次测试所需要的花费的总体水平下降得非常快速,因此这是一个完全可以进入的领域。如今,组建一个小型团队并不是天方夜谭,但在十到十五年前这是不可能实现的。”
Colorado 州雇佣数据科学家人数最多的公司之一是 datalogix 公司,但自从去年这家来自 Westminster 的公司被 Oracle 公司收购之后,它已经被改名为 Oracle Data Cloud 公司。它希望未来的员工所掌握的不仅仅是能够使其成为一名优秀数据科学家的研究型工具,而是其他更多的东西。
“我询问他们曾经面临过哪些冲突以及他们是如何解决它的。我十分希望找到一些最终能够在冲突中达成一致的人”,Oracle 数据云公司前首席数据科学家 Robin Opie 说道。他管理着大约九十名数据科学家。
“这个世界并不仅仅是由数字构成的。数字向人们提供了做出更好的决策的信息”,他说道,“分析者不可能了解所有的现实情况,因而如果他们不理会那些对这个世界有不同看法的人们所提出的现实情况,那么他们将会失去很大一部分信息。”
另一种数据科学家所需要的能力是能够将数据的含义传达给公司,否则的话,数据将毫无用处。
“想要成为一个有效率的数据科学团队,你必须能够与世界的其他地区进行对接,” Opie 说道。
增长还来自于渴望雇佣到数据科学家的非科技行业。在 Glassdorr 网站上,诸如 Kohl’s、AAA auto club 和Publisher’s Clearing House 都在招聘数据科学家。
根据一份 RJ Metrics 公司的报告,Microsoft、Facebook 和 IBM 这三家科技公司,雇佣了最多的数据科学家,分别是 272 人、132 人和 98 人。
过去的一个月,Anthem 保险公司在Denver发布了大量的和数据科学有关的工作招聘需求。但很快这家公司就表示,工作地点是弹性的,居住在美国其他地区的人们也可以前来应聘。
“数据科学在过去的几年中已经在零售业、互联网商业和金融科技领域发展得十分成熟。他们已经发展得很壮大了,我们必须利用这些优势”,Anthem 公司健康护理分析部门前首席数据科学家 Shwan Wang 说道,“我们更希望找到在健康护理行业工作且熟悉数据科学的人,但我们知道这只有有限的供给,因此这并不是一件容易的事情。”
数据科学的趋势是从沿海城市开始的,那里是更多科技公司的所在地。这一趋势同样带来了数据科学教育机构的崛起,例如 General Assembly,它是一家技术员培训机构。它于 2011 年创办于纽约,现今拥有世界范围内的十九个分校区。它计划今年秋天开始在 Denver 校区提供数据科学课程。
位于 Denver 的 Galvanize 公司在 2014 年末收购了 San Francisco 的 Zipfian 学院并且将Zipfian 学院的数据科学课程整合到了它的其他校区中。自 2014 年起,从它的加利福尼亚校区毕业的毕业生中,94% 的人已经找到了工作,平均薪酬为11万4千美元。
数据科学这一概念花了较长的时间才传入 Denver。Galvanize 公司在Denver的第一次数据科学课程是去年秋天才开始的。
“实际上,在现阶段我们很多学生正在做的工作就是运用他们数据方面的知识教育引导整个市场,”Joshua Bernhard 说道,他在 Galvanize 公司进行数据科学教学工作。“在Denver,各个行业的人们当下并不知道他们能够对数据做些什么,因为这里从来没有出现像我们的学生一样有经验的人。”
尽管如此,Ramesh 在毕业两周以来并没有遇到什么困难。她已经参加了五次面试并且已经得到了两份工作的聘用 。她还没有做出决定,但她并不后悔花费额外的十二周的时间去训练自己成为一名数据科学家。
“我所学到的是当我看到一组数据时,我知道应该马上做什么,以及我应该去寻找什么”,她说道,“如果我没有参加这个项目的话,我不可能培养出这样的直觉。我不可能知道居然还有如此多的技术可以从数据中提取信息。你会发现你所能做到的事情超乎你的想象。”
Tamara Chuang:tchuang@denverpost.com or visit dpo.st/tamara
美国 1 月 8 日数据科学家招聘信息
工作招聘人数:1736 人
基本薪酬中位数:11万 6840 美元
Glassdoor网站“ 2016 年美国最好的 25 个职业”排名:第一名
Glassdoor网站“ 2015 年美国最好的 25 个职业”排名:第九名
来源:Glassdoor
什么是数据科学家?
数据科学家不只是收集和分析数据,他们还要找到对于公司来说什么是重要的并解决公司如何能够盈利的问题。如今的数据来源已经不再局限于文本数据,而是可以来自于图像、人类行为以及手写笔迹。凭借着计算机的性能以及对开源软件的广泛使用,数据科学家可以将多种类型的数据结合起来从而找到新旧问题的解决方案。
薪酬
在 Glassdoor 网站“美国 2016 年最好的 25 个工作”的榜单中,它将数据科学家排在了第一位。截止 1 月 8 日,美国有 1736 个这样的工作招聘,这些工作的薪酬中位数是 11 万 6840 美元。根据位于Denver,专职培训数据科学家的 Galvanize 公司的消息,从它们位于 California 州的项目毕业的毕业生自 2014 年以来拥有 94% 的就业率和平均 11 万 4 千美元的起始薪酬。Galvanize 公司在去年秋天开办它们在Denver的第一个培训班,因此在Denver的就业率和薪酬的统计信息暂时空缺。
十万美元这一水平的薪酬十分诱人,但是它只包括了东西海岸的工作,因此它们可能无法反映Denver的薪酬现状。现在工作于 Oracle 数据云公司的 Robin Opie 说,它的公司为了能够招到顶级的数据科学家,给出了非常具有竞争力的薪酬。但整体来说,Denver地区的薪酬倾向于比东西海岸的薪酬低 10% 至 15% 。Robert Half Technology 是一家负责专业招聘的公司,在它的 2016 年薪酬指南中它指出,数据科学家的薪酬增幅在上年度科技型职业的薪酬增幅中排名第二位,并预测Denver的数据科学工作的起始工资在 11 万 4232 美元至 16 万 1130 美元这一区间。
如何开始
我们鼓励探索精神,但是你还需要一些计算机科学、统计学、数学分析的知识背景。你必须学会如何编写代码和程序。
好消息:高性能计算机的价格已经不再是无法承受的了,并且你可以使用各种开源的软件。
工具和编程语言包括 Hadoop、Hive、R 和 Python。
本地的许多数据科学家会定期碰面。在 Meetup.com 上,可以看到在Denver和 Boulder 地区有许多讨论数据科学和大数据的聚会。
入门级别的课程可以在一些大型的公开课网站上找到,例如在 Coursera 上,花费 470 美元你可以获得时长为九节课的数据科学引导课程。
在Denver也有更加昂贵的课程,例如 Galvanize 公司 1 万 6 千美元的课程或者 General Assembly 公司 1 万 4500 美元的课程,都提供十二个星期的沉浸式体验教学及本地校友团体的工作对接。
数据科学家在做什么?
“数据科学家分析互联网流量信息并寻找可能带来可疑活动的标准行为及异常行为的匹配模式,这能够帮助拦截大范围的零售信用卡威胁或者是分布式拒绝服务攻击,使其无法危害一个在线游戏平台。”
-Masum Muttalib,第三等级通讯公司微观经济学及运筹学负责人。他是一个二十人数据科学家团队的负责人。
“如果我们知道你最近在 King Soopers 的网站上点开了 Chobani 酸奶的一元返现活动,我们就能自动地优先排列出未来在其他商店中你可能感兴趣的任何和酸奶有关的优惠活动。”
-Bijal Shah,Ibotta公司前首席分析师。该公司推出的手机应用可以给在杂货店或是零售店购买的商品返现。
通过结合黑色星期五和剁手星期一的邮件标题及相应点击率的结果,EendGrid 公司发现那些写有“50% 折扣”的邮件并不比那些写着“20% 折扣”的邮件表现得更好,而那些在标题中完全不提及任何折扣信息的邮件点击率反而最高。
-Victor Amin,SendGrid 公司的一名数据科学家。他每天为他的客户发送数以百万封的邮件。
数据科学家能够快速地在乳腺癌活体组织切片的玻片中找到非正常生长的细胞,从而准确定位有丝分裂活动并指导病理学家观察幻灯片的特定区域,从而节约时间并进行二次会诊。
-Pooja Ramesh,最近毕业于 Galvanize 公司的毕业生。他将数据科学运用到了他的乳腺癌研究项目中。
健康护理行业将病人们的数据,例如处方信息、医生观察意见以及保险信息分开来保存。数据科学能够将病人们的记录整合起来,从而告知医生或是病人某种处方药是否需要补充。
-Shawn Wang,Anthem 公司健康护理分析部门前首席数据科学家。
当顾客浏览我们的数字频道时,我们能够向其推送高度个性化和高度相关的产品。