内容来源:2017年8月12日,爱因互动创始人兼CTO洪强宁在“网易博学实践日:大数据与人工智能技术大会”进行《对话机器人如何落地》演讲分享。IT 大咖说(ID:itdakashuo)作为独家视频合作方,经主办方和讲者审阅授权发布。
阅读字数:2161 | 4分钟阅读
获取嘉宾演讲视频及PPT,请点击:http://t.cn/RDoSTts
摘要
人工智能这个行业并不是纯算法论,算法固然重要,但是算法之外的东西对于一个创业公司来说会更重要。今天的分享会让大家了解到,机器人虽然是算法核心的应用,但在现有的技术条件下要想真正把它做好,除了算法之外还有更多需要考虑的东西。
什么是对话机器人?
Bot:自动化的完成某项任务,并以自然语言的方式进行沟通的机器人。
Chatbot:以自然语言为对话目的的机器人。
聊天机器人概念的出现非常早,甚至早过人工智能。1966年诞生了第一个对话机器人ELIZA,它是一个模拟的心理咨询师,标志着对话集成的开端。
在1970年有一个名为SHRDLU的对话机器人,它把对话限定在一个封闭域中,能够理解人们说的话并做出响应,在沟通的时候效果更好。
1988年出现了Jabberwacky,也是基于模式匹配,Jabberwacky中增加了娱乐性,它的回答会很幽默,人们在和它对话的过程中会感到很愉快。
1995年的时候出现了A.L.I.C.E,从技术角度来说,A.L.I.C.E.基于模式匹配创建了一套人工智能标记语言的引擎,它使人工智能变得更加规范化。
2001年,SmarterChild带来了新的变革。SmarterChild把聊天机器人搬到了互联网上,最多时候的用户数达到了三千万,影响扩大了很多。
2006年,Watson在一个问答型的综艺节目上打败了真人,因为它的知识库整理得非常好,所以准确率已经超过了人类。
2010年,苹果发布了siri。Siri是一个语音个人助理,给聊天机器人带来了新的应用场景。
到2016年,facebook发布了messager platform。2016年可以算是人工智能元年,facebook认为机会到了,所以它发布了一个平台,让大家可以在平台上去开发机器人。在发布第一个月时就拥有了上万个bot运行在该平台上。
理想很丰满
从1966年至今,有这么多的科学家前仆后继地让机器人用自然语言和人类进行对话,是因为有着丰满的理想,希望机器人能够拥有人类的智能。而人工智能的一个定义是,可以通过图灵测试的智能就是人工智能。图灵测试本身就是一个对话机器人的测试。
现实很骨感
大概在2016年4月的时候,大家对于facebook发布的messager platform抱有极高的热情,很多人在这个平台上开发机器人。
但到了2017年2月,facebook发现这些机器人的效果非常差,里面的错误率高达70%。于是facebook收缩了这部分的投入。
那么我们现在做对话机器人是不是过早了?我觉得是,但也不是。“是”的原因就是现在的人工智能技术在自然语言理解上还处于早期阶段,这个时候要让一个算法能准确理解人类在说什么,还是有些难度;我说“不是”是因为现在由于对话的发展,人们已经习惯在对话平台上进行交互,只要选择合适的场景、算法和对话方式,我们还是可以做到不错的准确率。
对话机器人如何落地?
算法与工程紧密结合
因为目前算法还不够成熟,所以做对话机器人的公司需要紧追工业界、学界任何一点可能的成绩,不断尝试各种新的优化。
这使得我们在算法框架的层面上处于一个非常不确定的状态。工程和算法紧密结合,所以工程需要给算法提供一个非常好的条件,让算法可以很容易地尝试不同方式。
开发域 vs.封闭域
在聊天机器人这个行业,我们解决的问题域大致有两种流派,一种是开放域,一种是封闭域。
开放域是不限定用户提什么问题,我们都要给出一个正确的解答。目前这个场景能做到的只有闲聊。
我们希望能够让机器人真正理解人类说的话并执行指令,在对话中还要向用户去个性化推荐产品,在现有的技术框架下就只能做封闭域。封闭域既可以做检索式的回复,也可以使用生成式的方式来做。
封闭域对话
封闭域对话需要清晰地定义出人类说的话有几种可能性,而机器要做的就是把这句话定义出是哪个领域、什么意图以及要完成这个意图需要知道哪些槽位信息,这些都是要预先定义的,工作量很大。
要想能够在比较低的成本下完成这件事,就需要规范数据结构,通过原始语料分析自动提取,再逐步增加意图。
让机器人主导对话
可以避免主题发散,用户的对话内容是可预期的。可以引导对话目标,避免无休止的调戏。
人性化的对话设计
对用户的回答做出针对性反馈,并优雅地打破沉默。出现异常的时候可以通过卖萌的方式来处理,需要对用户表达出正面的情绪,要得到用户的理解并给出可解决的方案。
善用对话的私密性
基于对话的CUI和基于图形的GUI非常显著的区别就是CUI是一对一的对话,更具有私密性。GUI特别适合展示广度,而CUI在对话场景下更适合展示深度。GUI的空间感更强,CUI则更具有时间感。由于它的私密性,还可以做很多个性化的操作,加强用户的参与感。
在对话过程中机器人需要记住用户曾经说过什么,对用户体验非常好,所以需要有一个长期记忆,可以在里面进行个性化推荐。
人机协作
当机器无法百分百接受人类说的话时,可以转接人工服务。同时在用户输入的时候提示可以输入哪些内容,这样用户输入的内容一定是在可理解的范围之内,大幅提高准确率。即使是在人工服务的时候,依然可以对回复提出建议。这个本身就是一个标注过程,告诉机器人它的回复是正反馈还是负反馈。
管理期望
有多少人工,就有多少智能。并不是所有事情都适合机器做,只把重复性、确定的事情交给机器。一定会有不准确的情况发生,我们只要在出现不准确的时候能够有一个好的解决方案,让用户仍然能把事情做完,那么不准确还是可以被接受的。数据是AI的粮食,没有数据就没有AI。强人工智能还是很遥远。
我们在实践的过程中发现,真正影响项目能否成功的因素,算法虽然很重要,但我前面所介绍的那些与算法并不是十分紧密相关。很多是产品的选择、场景的选择和对话的设计等方面,其实它们起到的作用并不亚于算法。
我今天的分享就到这里,谢谢大家!