自从AlphaGO击败围棋世界冠军李世石之后,AI正式进入大众的视线,有人说又是一次AI泡沫,有人说真正的AI时代到来了,本文暂不争论这些,只从底层技术来推演之后的可能性。
人工智能自从1956年达特茅斯会议提出后,经历了多次起伏,每次都给人以希望,但最后又销声匿迹,直到半个世纪后的2006年,深度学习算法取得突破后,才让人开始相信人工智能真的来了,甚至还担心AI会接管地球,人类会沦为阶下囚,不过随着AI技术的持续落地,大家的担心从被奴役,变成是否会失业,沦为流浪汉,下面是曾被朋友圈刷屏的《纽约客》杂志封面。
那AI到底能做到哪些,我们应该如何应对和使用AI技术呢?
现行的AI技术主要包括:语音技术、图像技术、自然语言处理、知识图谱和用户画像。
语音技术
语音技术主要包括语音识别、语音合成、语音唤醒三部分。
- 语音识别的难点主要在近场、远场、车载等场景下的智能识别;
- 语音合成需要做到个性化、有情感;
- 语音唤醒的目标是无唤醒词使用(和有唤醒词的情况难度不是一个级别哈);
这些技术可以应用到哪些场景呢?
- 在手机上,可以输入法结合,提供语音输入方案;
- 在家里,可以和电视结合,通过语音搜索电影,启动关闭电视等;和音响结合,可以操控家里的各种电器,包括空调、冰箱、洗衣机、微波炉、电饭锅、窗帘、灯光等;
- 在车上,操控车载音响、空调、灯光、雨刷等;
- 在医疗上,可以做语音电子病历;
- 在教育上,纠正发音、检索课件录音等;
- 在公益上,还可以保留方言(合成爸妈的声音,很好玩吧);
图像技术
图像技术也成为计算机视觉,主要包括OCR识别、人脸识别、指纹识别、图像处理、视频处理、AR/VR等。
在工作中这些技术可以应用的地方如下
- OCR识别:身份证、银行卡、驾驶证、行驶证、名片识别、车牌、票据、营业执照等证件识别
- 人脸与指纹识别:考勤打卡、刷脸支付、智能安防
- 图像处理:美图、图像审核、图像搜索
- 视频处理:视频分割/后期制作、视频内容分析、视频内容审核
还有非常让人期待的自动驾驶。
自然语言
自然语言一直以来,都是人类智慧的象征,现在也可以被机器学会了,包括机器翻译、Siri/小冰/度秘等聊天机器人,智能客服、情感分析、舆情监控等。
有没有发现最近的银行客服都加上了自动语音服务,科大讯飞也宣称3年后IVR导航讲成为历史。
- 里约奥运期间,今日头条的张小明,也一度成为热点,能秒级写完赛事报道(以后让小编怎么混呢)
- 智能客服也在网易七鱼、腾讯、Udesk、小i等产品的推动下,逐步进入市场
- 而BBC的一个报告也指出电话推销员、打字员被人工智能替代的概率高达99%
- 导游、翻译、文员的岗位也是岌岌可危啊(程序员还是很安全的,嘿嘿)
知识图谱
知识图谱也被称为知识领域的可视化或知识领域的映射地图。主要应用于智能检索、教学辅导、辅助做题、甚至应试考试都不在话下。
百度知识图谱已经积累了几亿个实体,构建了几千亿个事实(实体和实体之间的关系),用于知识计算和推理。
一站到底和搜狗就推出一款机器人“汪仔”,也是秒杀各届高考状元呀。
用户画像
用户画像主要包括人口属性、行为习惯、兴趣爱好、位置信息和目标意图等;
可通过用户画像做个性化推荐、智能匹配等。
现在的AI已经在感知(语音、图像、视频)和认知(语言、知识和画像)方面取得了很大的突破,再加上现在的大数据存储、计算能力,而算法也在不断迭代优化,百度的PaddlePaddle、Google的TensorFlow也为开发者提供了非常好的机器学习框架;AI已经在象棋、围棋、翻译、考试、安防、医疗、教育等方面追平或超越了人类,就像我们一开始说到的一样,我们的担心不是多余的,但是“人工智能并不是最可怕的,掌握了人工智能的人类才是最可怕的!”