谷歌的两位AI明星女科学家——李飞飞和李佳上周联合宣布,谷歌正式推出Cloud AutoML,通过在网页上选定你的需求(比如“我要一个能够识别客厅的AI模型”)、再上传少量素材(比如“100张客厅的照片”),系统就可以自动生成这个AI模型!
这是自从李飞飞和李佳加入谷歌后一个里程碑式的大招,据两人介绍,目前CloudAI团队推出了10多个AI产品,超过1万家公司在使用。
这也就意味着,原先需要众多AI工程师、AI科学家才能搭建好的深度神经网络模型,现在每个人都能够在自己的电脑上通过鼠标点击、拖拽图片等行为自动生成,一行代码都不需要编写,最快只需要几分钟就能自己造一个AI模型出来——是不是很黑科技?
谷歌在2017年就发布了Cloud Machine Learning Engine来帮助开发者处理各种大小以及类型的文件,那些有机器学习基础的开发团队借助它以及API接口可以实现处理图片、语言、视频、翻译等各种各样的功能。现在已经有许多公司已经在使用谷歌的云端机器学习引擎了,但是还有更多的东西可以带给大家,那就是Cloud AutoML。
谷歌去年5月发布AutoML,当时谷歌CEO皮查伊说,现在设计神经网络非常耗时,对专业能力要求又高,只有一小撮科学家和工程师能做。为此,谷歌创造了一种新方法:AutoML,让神经网络去设计神经网络,现在谷歌又把这个技能放到云上了。
而如果一家公司想要用此打一个完整的商用模型,也只需要一天的时间。
▲AutoML界面
虽然现在开放出来的只有Cloud AutoML Vision功能,能够定制化生成用于特定图像识别的AI模型。但是李佳和李飞飞都表示未来Cloud AutoML的覆盖范围将会更广,囊括图像、语音、NLP等方面。
从技术层面来看,谷歌通过迁移学习(Transfer Learning)将已训练完成的模型,转移到新的模型训练过程。这样,能够用较少量数据训练出机器学习模型。对于医疗领域而言,这点尤为重要,因为在为罕见疾病和一些特殊案例建模时,往往无法取得足够的训练数据。此外,谷歌还通过learning2learn功能自动挑选适合的模型,搭配超参数调整技术(Hyperparameter tuning technologies)自动调整参数。
AutoML由控制器(Controller)和子网络(Child)2个神经网络组成,控制器生成子模型架构,子模型架构执行特定的任务训练并评估模型的优劣反馈给控制器,控制器将会将此结果作为下一个循环修改的参考。重复执行数千次“设计新架构、评估、回馈、学习”的循环后,控制器能设计出最准确的模型架构。
在这一过程中,搭建训练模型、调参等种种老大难题都能被自动解决,这也将Google Cloud这一新服务与微软Azure ML的机器学习平台区分开。
解决了机器学习的技术门槛后,只要有开发能力,就算不懂机器学习知识,也能通过AutoML打造出一套企业级的机器学习应用或AI应用。
众所周知,机器学习专家的稀缺和水涨船高的薪资意味着大多数企业无法聘用自己的数据科学家,如果此项服务能够成熟落地,谷歌将无疑在众多云服务之争中开辟一大片新市场。
谷歌云AI研发负责人李佳(左)和首席科学家李飞飞
该产品发布之后,Google Cloud 人工智能和机器学习首席科学家李飞飞连发两条推特,“在几个月的时间里就将最前沿的技术转化为大范围普及的产品,这是一段难忘且振奋人心的过程,我们希望 AutoML Vision 可以为我们的客户解决问题。”
图丨李飞飞连发两条推特
除此以外李飞飞和李佳还在博客上发布亲笔文章,详细介绍了她们开发 Cloud AutoML 的初衷和远景,以下为文章全文:
当我们两年前加入 Google Cloud 的时候,我们就承接过来了让 AI“民主化”的重担。那其中最首要的目标就是降低人工智能领域的进入门槛,将 AI 技术提供给尽可能多的开发者、研究员和公司。
我们 Google Cloud AI 团队在实现这一目标的道路上一直在稳步推进。2017 年,我们推出了 Google Cloud Machine Learning Engine,帮助具备机器学习专业知识的开发人员轻而易举地创建适用于所有规模、所有数据的 ML 模型。我们展示了如何在预先训练模型之上创建当前所需要的机器学习服务,比如视觉、语音、NLP、翻译和 Dialogflow 等 API,毫无疑问,这将极大地提升业务应用规模和速度。此外,我们的数据科学家和 ML 研究人员的社区 Kaggle 已经发展到超过一百万个成员。如今,已有超过 10,000 家企业使用 Google Cloud AI 的服务,其中不乏像 Box、Rolls Royce Marine、Kewpie 和 Ocado 等公司。
但是,这还远远不够,我们还有更多的事情可以做。我们注意到,目前世界上只有少数企业能够拿出足够的人力资源和经费预算来拓展在 ML 和 AI 领域的研究,但现实是能够创建高级机器学习模型的人数十分有限。而自定义 ML 模型的创建也是一个复杂的过程,那些拥有机器学习工程师的公司也仍然需要花费时间去管理。虽然谷歌通过 API 提供了能够执行特定任务的预训练机器学习模型,但是如果我们想要将 AI 带给每个人,则还有很长的路要走。
为了缩小这之间的差距,让每个企业都能乘上人工智能的顺风车,我们推出了 Cloud AutoML。Cloud AutoML 使用诸如 learning2learn 和谷歌迁移学习等先进技术,来帮助在机器学习领域涉猎不深的企业构建自己的高品质自定义机器学习模型。我们相信,Cloud AutoML 将使人工智能专家更高效率地工作,在 AI 中拓展新的领域,并帮助技术娴熟的工程师构建他们以前梦寐以求却难以达成的强大 AI 系统。
当然,我们的第一个 Cloud AutoML 版本将是 Cloud AutoML Vision,这一服务可以实现更快、更轻松地创建用于图像识别的自定义机器学习模型。其拖拽式的操作界面可以让你轻松地上传图像、训练并管理模型,然后直接在 Google Cloud 上部署这些已经训练成熟的模型。通过流行的公共数据集(比如 ImageNet 和 CIFAR)进行分类的早期结果显示,使用 Cloud AutoML Vision 比更通用的 ML API 分类错误更少,结果也更准确。
以下是官方提供的有关 Cloud AutoML Vision 更多的信息:
更高的准确性:Cloud AutoML Vision 是基于谷歌领先的图像识别方法,例如迁移学习和神经架构搜索技术。这意味着即使你的公司在机器学习领域没有深耕,也可以得到更准确的模型。
加快生产就绪(Production-ready)模式的周转时间:使用 Cloud AutoML,您可以在几分钟内创建一个简单的模型,并以此来试用您的 AI 应用程序,或者在一天之内构建完整的生产就绪模型。
易于使用:AutoML Vision 提供了一个简单易用的用户操作界面,你可以很方便地指定数据,然后将数据转换为针对您的特定需求定制的高质量模型。
URBN 的数据科学家 Alan Rosenwinkel 表示:“Urban Outfitters 一直在探索新的方法来提升我们客户的购物体验。”那么,创建并维护全面的产品属性对于为客户提供相关的产品推荐、精准的搜索结果和行之有效的的产品过滤器是至关重要的;然而,手动标注产品属性是一项旷日费时的工作。为了解决这个问题,我们团队一直在评估是否可以以 Cloud AutoML 作为突破口,通过细微的产品特征来将产品归因过程自动化。有鉴于此,Cloud AutoML 非常有利于帮助我们的客户提供更好的发现、推荐和搜索体验。”
迪士尼消费品和互动媒体首席技术官兼高级副总裁 Mike White 说:“我们正在用 Cloud AutoML 技术来建立视觉模型,用迪斯尼卡通中的人物、类别和颜色等信息来标注我们的产品。这些注解正在被整合到我们的搜索引擎中,通过更多的相关搜索结果,用以加快发现和推荐 Disney 商店的产品,从而增强访客的体验。”
伦敦动物学会技术主任 Sophie Maxwell 告诉我们:“我们是一个致力于保护动物及其栖息地的国际组织,而如果要更好地履行这一使命,其中的关键要求是追踪野生动物种群以更好的了解它们的分布信息及人类对这些物种的影响。”为了实现这个目的,我们在野外部署了一系列相机。然后这些设备捕获的数据将由人工进行分析,并标记出他们究竟是大象、狮子还是长颈鹿,很显然,这是一个劳动密集型的操作过程。因此,我们的技术部门一直与 Google Cloud ML 团队保持密切的合作,有了 Cloud AutoML 这一激动人心的技术,我们可以更便捷地实现图像标记的自动化,借以更深入的了解并保护世界范围内的野生动物。”
AutoML Vision 是我们与 Google Brain 和其他 Google AI 团队密切合作的结果,也是尚在开发中的 Cloud AutoML 产品其中的首个。虽然我们还没有彻底将人工智能的进入门槛消灭,但我们已经受到了 Cloud AI 产品 10,000 多个客户的深刻启发。我们衷心地希望 Cloud AutoML 的发布将有帮助更多的企业借助 AI 的力量打开更广阔的未来。
如果您有兴趣试用 AutoML Vision,可以提交此表单https://services.google.com/fb/forms/cloudautomlalphaprogram/
目前谷歌还没有公布Cloud AutoML的服务价格,开发者还需要等待。
值得一提的是,继北京和上海办公室之后,Google 悄悄在深圳开设了第三个办公室,凸显了公司的硬件和广告业务的增长。新办公室的人数预计将会与北京上海看齐,将会达到 300 人左右规模。