Why always 百度? 飞桨乌镇夺魁,AI进入工业大生产阶段
枕水人家的木门徐徐打开,互联网再次进入到乌镇时间。
作为乌镇互联网大会的保留节目,组委会第四次面向全球发布了“世界互联网领先科技成果”,涉及人工智能、5G、大数据、云计算、区块链等前沿领域的原理、技术、产品或商业模式上的创新,揭示了年度最具代表性的科技创新成果。
其中飞桨(PaddlePaddle)深度学习平台成为入选的第四个百度产品,就如百度首席技术官王海峰之前为飞桨作出的注解:“作为新一代人工智能的核心基础,深度学习技术及平台具有很强的通用性,呈现出自动化、标准化和模块化的大生产特征,正在推动人工智能进入工业大生产阶段。”
01 开发者的“船桨”
如果要为中国的产业智能化进程找一个活化石的话,百度无疑是最适合的人选。迄今为止进行的四次“世界互联网领先科技成果”评选中,百度每年都有项目入选,且全部集中在人工智能领域。
2016年的世界互联网大会期间,刚刚发布两个多月的百度大脑,成为当年“世界互联网领先科技成果”的最大热门。作为百度人工智能的核心技术引擎,百度大脑涵盖了视觉、语音、自然语言处理、知识图谱、深度学习等AI基础技术,开发者只需要进行一个简单的调用,即可获得百度的AI能力。
2017年智能音箱迎来了爆发式增长的元年,不过出现在“世界互联网领先科技成果”评选名单中的产品,不是某家知名的智能音箱品牌,而是百度的对话式人工智能系统DuerOS,可以适用于音箱、电视、冰箱、手机、机器人、车载、可穿戴等多种场景,语音交互开始从科幻电影走进千家万户。
2018年代表百度入选“世界互联网领先科技成果”的是Apollo自动驾驶开放平台,作为一个开放的、完整的、安全的自动驾驶开源平台,Apollo的代码已经跑通了园区物流、自动泊车、园区接驳、智慧农业、高速物流、智慧环卫、健康养老等场景,并推出了面向量产的人车联网解决方案小度车载OS。
2019年崭露头角的飞桨深度学习平台,可以说是没有悬念的“世界互联网领先科技成果”。不仅在基本功能、性能、芯片支持的完备性等技术指标上与谷歌、Facebook等主导的深度学习平台相当,还在中文自然语言处理的算法模型、大规模分布式训练、推理引擎等技术上远远领先于国外同类产品。
从时间上看,从输出AI技术的百度大脑,到提供场景化解决方案的DuerOS和Apollo,再到端到端的开源深度学习平台,百度人工智能技术在乌镇上的“夺魁史”,也是百度AI开放的进化史。
按照百度首席技术官王海峰的观点,深度学习平台就像是所有人工智能应用的一个基础的底座,从组网、训练、到预测,深度学习平台对底层语言和重要算法模型进行封装,极大降低了研发门槛,属于典型的共性技术平台。
大抵也就可以理解百度将深度学习平台命名为“飞桨”的原因。
百度大脑的技术输出,让人脸识别、语音识别等AI基础能力逐渐落地应用;DuerOS和Apollo在语音交互、自动驾驶领域的深耕,加速了人工智能的落地应用;飞桨就像是深度学习开发者手中的“船桨”,要给开发者独自过河的能力。
02 告别“摩登时代”
至于百度为何要打造深度学习平台,以及飞桨为何会得到世界互联网大会组委会的一致认可?不妨从一个“假想”说起。
电影大师卓别林在《摩登时代》中以独特的喜剧表演,对美国工业起步时期劳动人民的生活悲剧展开进行了辛辣诙谐的讽刺。如果卓别林生活中智能化刚刚起步的当代,“摩登时代”的故事多半会是这样的场景:
一位中年脱发的程序员被老板安排了各种人工智能的开发任务,每接手一个新项目就要熬夜搭建新的深度学习模型,为复杂的神经网络写上几十万行的代码。每天的工作内容要么在写代码,要么在找bug,重复着枯燥乏味的“流水线”工作……
而飞桨等深度学习平台的出现,就是要帮助开发者从写代码的工作中解脱出来,利用搭积木的方式进行工作:一个深度学习平台就像是一套积木,深度学习模型和算法就像是积木的组件,开发者可以根据不同的需求进行组装。
当然,被飞桨们告别“摩登时代”的,除了熬夜加班的程序员们,还有哪些真正忙碌在工业流水线上的工人们。
比如在农业生产领域,每到桃子成熟的季节,桃农们需要在采摘后进行品质筛选,大多时候需要雇佣大量工人用肉眼挨个识别,由于缺少质量上的硬性标准,往往会造成质量参差不齐的现象。有开发者制造了一台智能桃子分拣机,在飞桨上进行了6个小时的桃子智能分类模型训练,分拣的准确度就达到了90%以上,节约了90%以上的人力成本;
再比如在林业防治方面,红脂大小蠹一种危害超过35种松科植物的害虫,从1998年到2004年就导致600多万株松树枯死。而对红脂大小蠹密度及分布监控,需要工作人员进行实地探查,不仅工作专业度要求高,还要花费大量的时间。北京林业大学基于飞桨打造了一套林业虫情监测系统,在模型训练后可以准确识别出红脂大小蠹,原本需要两周的检查任务被压缩到了一个小时。
如此也就解释了王海峰为何要刻意提及“工业大生产”的说法,有了深度学习平台这样的通用性平台,人工智能的应用不再是象牙塔里的小规模测试,从传统的农林牧,到半自动化的工业生产,再到城市里服务业,人工智能正加速渗透到生活的方方面面。
简单来说,飞桨的价值不仅仅局限在给开发者提供了AI应用落地的“船桨”,还将加速人工智能进入工业大生产阶段,《摩登时代》中的流水线工作即将成为历史。
03 有担当的“头雁”
百度为何要打造深度学习平台,或许还有另一个原因。
连续四年入选“世界互联网领先科技成果”的百度,无疑是中国人工智能产业中的“头雁”。就像坊间流传的一种说法:头雁勤,群雁就能“春风一夜到衡阳”;头雁懒,只会“万里寒云雁阵迟”。中国人产业智能化的进程,或多或少肩负在以百度为代表的“头雁”身上。
一味地利用人工智能讲故事画大饼,用于推高估值或市值;还是做人工智能技术的保守派,以此作为对友商降维打击的武器;抑或是扎实推动人工智能应用落地,扮演起产业智能化的领跑者?所幸,百度在飞桨深度学习平台上释放了积极的信号:
一方面,深度学习平台处于硬件层和应用层之间,向下对接芯片指令集,向上承接各种业务模型、行业应用,作用相当于个人电脑时代的Windows和移动时代的Android,堪称人工智能技术研发和产业化的关键基础设施。
百度没有选择将深度学习平台“私有化”,飞桨深度学习平台已累计服务150多万开发者,仅在定制化训练平台上就有超过6.5万企业用户,发布了16.9万个模型。同时百度还和华为等合作伙伴进行了软硬一体的合作优化,一同促进更多人工智能应用落地,切实推动中国的产业智能化。
另一方面,世界上的深度学习平台不只飞桨一个选项,谷歌、Facebook、亚马逊等都推出了类似的产品,甚至在时间上稍早于百度。当美国开源平台的争夺战早已火星四溢的时候,百度是否有必要去“凑热闹”?
这个问题并不难回答,至少芯片行业的遭遇已经让不少中国企业吃够了“下游之苦”,在“智能时代的操作系统”的选项上,作为国内当前唯一全面开源开放、功能完备的产业级深度学习平台,无论是基于人工智能的应用性、安全性,还是中文开发的必然性,飞桨深度学习平台的意义都不言而喻。
或许还有另外一个问题,为什么国内的其他互联网巨头在深度学习平台上近乎静音?可以给出的解释是,深度学习开始大规模应用的时候,仍然面临很多棘手问题,比如如何提升深度学习模型的开发效率,如何让训练模型真正可以产业化应用,如何平衡部署时的推理速度和成本……
All in AI的百度,可能是顾忌最少的互联网巨头,尤其从王海峰挂帅AIG、ACG、TG三大事业群的动态来看,加速产业智能化已经是百度自我赋予的使命之一。毕竟只有当行业看到AI技术遍地开花的实质利好,真正意义上的产业化才会提上日程,这恰恰就是雁群中头雁应有的担当。
04 写在最后
王海峰曾这样阐述他对技术的理解:“AI的发展最终还是要回到’服务用户需求’的本质,利用好人工智能来服务好我们的用户和客户,以及更好地打磨AI能力来推动各行各业的效率提升,是每一位人工智能领域从业者的期望。”
如此来看,从开放AI能力的百度大脑,到DuerOS、Apollo、飞桨等操作系统的开放开源,百度正在帮助开发者们“推倒”人工智能的技术门槛、成本门槛和时间门槛,对人类科技革命史上的影响,注定不会局限于“世界互联网领先科技成果”的奖项。