浅谈人工智能技术现状及应用场景

自从AlphaGO击败围棋世界冠军李世石之后，AI正式进入大众的视线，有人说又是一次AI泡沫，有人说真正的AI时代到来了，本文暂不争论这些，只从底层技术来推演之后的可能性。

人工智能自从1956年达特茅斯会议提出后，经历了多次起伏，每次都给人以希望，但最后又销声匿迹，直到半个世纪后的2006年，深度学习算法取得突破后，才让人开始相信人工智能真的来了，甚至还担心AI会接管地球，人类会沦为阶下囚，不过随着AI技术的持续落地，大家的担心从被奴役，变成是否会失业，沦为流浪汉，下面是曾被朋友圈刷屏的《纽约客》杂志封面。

被机器替代的流浪汉

那AI到底能做到哪些，我们应该如何应对和使用AI技术呢？

现行的AI技术主要包括：语音技术、图像技术、自然语言处理、知识图谱和用户画像。

语音技术

语音技术主要包括语音识别、语音合成、语音唤醒三部分。

语音识别的难点主要在近场、远场、车载等场景下的智能识别；
语音合成需要做到个性化、有情感；
语音唤醒的目标是无唤醒词使用（和有唤醒词的情况难度不是一个级别哈）；

这些技术可以应用到哪些场景呢？

在手机上，可以输入法结合，提供语音输入方案；
在家里，可以和电视结合，通过语音搜索电影，启动关闭电视等；和音响结合，可以操控家里的各种电器，包括空调、冰箱、洗衣机、微波炉、电饭锅、窗帘、灯光等；
在车上，操控车载音响、空调、灯光、雨刷等；
在医疗上，可以做语音电子病历；
在教育上，纠正发音、检索课件录音等；
在公益上，还可以保留方言（合成爸妈的声音，很好玩吧）；

图像技术

图像技术也成为计算机视觉，主要包括OCR识别、人脸识别、指纹识别、图像处理、视频处理、AR/VR等。

在工作中这些技术可以应用的地方如下

OCR识别：身份证、银行卡、驾驶证、行驶证、名片识别、车牌、票据、营业执照等证件识别
人脸与指纹识别：考勤打卡、刷脸支付、智能安防
图像处理：美图、图像审核、图像搜索
视频处理：视频分割/后期制作、视频内容分析、视频内容审核
还有非常让人期待的自动驾驶。

自然语言

自然语言一直以来，都是人类智慧的象征，现在也可以被机器学会了，包括机器翻译、Siri/小冰/度秘等聊天机器人，智能客服、情感分析、舆情监控等。
有没有发现最近的银行客服都加上了自动语音服务，科大讯飞也宣称3年后IVR导航讲成为历史。

里约奥运期间，今日头条的张小明，也一度成为热点，能秒级写完赛事报道（以后让小编怎么混呢）
智能客服也在网易七鱼、腾讯、Udesk、小i等产品的推动下，逐步进入市场
而BBC的一个报告也指出电话推销员、打字员被人工智能替代的概率高达99%
导游、翻译、文员的岗位也是岌岌可危啊（程序员还是很安全的，嘿嘿）

知识图谱

知识图谱也被称为知识领域的可视化或知识领域的映射地图。主要应用于智能检索、教学辅导、辅助做题、甚至应试考试都不在话下。
百度知识图谱已经积累了几亿个实体，构建了几千亿个事实（实体和实体之间的关系），用于知识计算和推理。
一站到底和搜狗就推出一款机器人“汪仔”，也是秒杀各届高考状元呀。

用户画像

用户画像主要包括人口属性、行为习惯、兴趣爱好、位置信息和目标意图等；
可通过用户画像做个性化推荐、智能匹配等。

现在的AI已经在感知（语音、图像、视频）和认知（语言、知识和画像）方面取得了很大的突破，再加上现在的大数据存储、计算能力，而算法也在不断迭代优化，百度的PaddlePaddle、Google的TensorFlow也为开发者提供了非常好的机器学习框架；AI已经在象棋、围棋、翻译、考试、安防、医疗、教育等方面追平或超越了人类，就像我们一开始说到的一样，我们的担心不是多余的，但是“人工智能并不是最可怕的，掌握了人工智能的人类才是最可怕的！”