实现人机对话场景的产品梳理

人机对话场景梳理的基本流程

image.png

第1阶段：需求分析。当前阶段需要有熟悉业务的人员参加，例如：产品经理、业务负责人等。先分析业务，明确业务中哪里需要通过和用户的对话来完成；再确认相关对话逻辑。最后基于之前的分析，从之前沉淀的数据中提取有价值信息，用于后续技能创建与训练；如果是新业务或之前没有准备，也先不用着急，我们可以先完成其他部分，但综合来看，业务中的真实数据是训练技能时最理想的“知识”。
第2阶段，创建&训练技能。当前阶段就是要赋予技能模型对话能力了。赋予技能模型对话能力和教小朋友说话一样，要先确认教他的知识点，而这些知识点就是技能的意图。基本定义灌输完成后，就需要通过大量的练习题来帮助技能模型理解、巩固与记忆。最后，可以通过考试，来检测技能模型的学习成果。当考试合格后，就可以用于实战了，即接入到业务中（API、SDK等）。
第3阶段，持续优化。因着业务程度复杂、用户画像变化等因素，技能之前掌握的只是知识可能不足以应对新市场，这时我们需要通过更多的“练习”与“考试”来帮助技能提高能力。目前技能还无法完全自主学习并提高自己，还需要训练人员辅助。

需求分析

需求分析是训练智能对话技能举足轻重的一步，需要基于自身业务场景进行深入透彻的思考，从而明确整个对话技能的架构，后续的技能创建与训练工作全部在此架构的基础上展开。这一步在训练智能对话技能时很容易被忽视，但草率分析需求即着手训练的技能往往后续需要投入更多的时间和精力进行调整，甚至需要推翻重来。

挖掘需求，确定边界

首先是对业务场景进行分析，以酒店服务这一场景为例，存在很多酒店助手“可以做”的业务，我们应当从用户需求和用户体验入手，思考在该场景下用户的刚需，以及如何通过引入对话交互来大幅提升用户体验，从而在大范围的可以做的业务中找到其中必须做和应该做的业务。

在酒店服务这一场景下，用户主要的活动空间是在酒店房间内，因此酒店助手的首要目标为尽可能优化用户在酒店房间内的体验，像联系前台、呼叫客房服务这些都是需要优先满足的需求；而设置日程提醒、控制房间内的家电，这些功能通过语音交互来实现可以使用户进一步感受到智能化酒店的舒适和创新；意见反馈有助于收集用户的反馈以不断优化酒店的服务，通过酒店助手的对话来完成可以获得比纸质调查表更高的反馈率。

而关于酒店的常见问题的咨询，也是酒店助手应当实现的功能之一：一方面这些问题对于新入住的顾客而言是切实需要获得解答的，另一方面直接通过对话方式获得问题的解答比传统的从宣传单中查找或是致电询问前台都更加简单便捷。

对于一些超出酒店基本服务以外的拓展服务，如新闻播报、城市导览等功能，可以对用户体验起到一定的提升，但并非强需求，同时需要对接大量的资源库；而我们的目标是首先搭建最小可用技能，因此这部分功能可以先不去开发或低优先级开发。

明确目标，确定任务类型

在确定了业务场景的边界之后，我们就需要明确这些功能的目标，从而确定任务的类型，不同的任务类型对应着不同的配置方式；首先我们来了解一下任务类型的分类：

image.png

可以看出，任务类型区分的关键在于任务目标的有无以及是否需要把请求参数化；了解了这一点后，我们不难将之前梳理的功能进行分类：

image.png

功能定义：确定优先级及关键信息要素

在确定边界和目标后，我们就可以动手对功能进行定义了，在这一阶段，我们需要确定各功能的优先级，并确定每个功能的实体要素。

首先是优先级的确定，其实在确定边界的过程中，我们已经对功能的重要程度和实现难度进行了分析，在此基础上不难确定出功能的优先级：

image.png

关键信息要素的分析。任务型的对话需要将请求参数化，相应的我们就需要分析要完成每个对话都需要将哪些实体要素参数化，而这些实体要素所对应的正是技能的对话意图及其词槽。我们以酒店房间内场景下P0优先级的功能为例进行分析，可以梳理出如下的关键信息要素：

image.png

可以发现标红部分因为其关键信息要素的重合而产生了意图的合并，具体如何处理相似功能间意图的拆解与合并，我们在下节对话逻辑梳理中展开讲解。

对话逻辑梳理：任务型对话的常规与异常情况、问答型的知识分类

任务型对话的意图梳理

任务型对话因具有将请求参数化的这一特点，在配置到对话意图时需整体考虑该场景下的相似任务和相关任务，在这一阶段将对话任务与意图间的映射关系梳理清晰，可以在后续的配置中达到事半功倍的效果。

以上节中进行了关键信息要素分析的功能为例，在物品需求类型的功能间和智能家电的开关控制中出现了功能的关键信息要素重合的情况，下面我们分别针对这两类功能进行分析：

物品需求类型功能

在实际的酒店场景中顾客可能产生远比本文列出的示例更多的物品需求，在物品需求与意图之间建立一一映射关系不仅会浪费大量的人力，而且存在拓展性差、不同意图间的query相似性强相互干扰影响效果的缺点。因此我们采取合并意图、通过词槽来区分具体物品的方式，这种方式前期工作量小，后期拓展性强（只需调整词槽词典即可增删物品）。但也不可不管三七二十一将所有物品需求合并为同一意图，需要从实际场景出发进行合理的意图合并与区分。

image.png

家电控制类型功能

家电控制类型的功能在意图的梳理上与物品需求类型的功能基本相同，在上节的梳理中考虑方便未来的拓展，把只有开关指令的设备汇总到一个意图中。

注意：本例中假设灯具只有开关两种指令，若存在更复杂的指令如（柔和模式、工作模式……），则需单独设立意图不可合并。

问答型对话的意图梳理

问答型对话没有需要参数化的内容，往往具有固定的标准答案；这类型的对话逻辑梳理其实就是要对问题进行分类，或者叫知识分类。比如酒店的问题咨询可以如下分类：

image.png

场景数据收集：在真实场景下用户会怎么问？

人工智能实现语义理解的过程，和教牙牙学语的小朋友讲话的过程是相似的：最初他只能懂你教他的一模一样的内容（训练数据量少时泛化能力差），等到教的内容多了之后就可以理解这个意思的不同表达方式（基于大量的训练数据产生泛化能力）。

因此我们在收集场景数据时，需要尽可能贴近真实场景下用户的表达方式，最好是从实际业务场景中沉淀下来的真实数据，全面覆盖用户在该场景下可能出现的表达方式。

配置对话模板

对话模板是基于用户的表达方式归纳出的匹配规则，归纳得当的对话模板配置起来简单快速，可以识别多种表达方式，适合短时间内使技能达到可用的对话效果。同时对话模板的优先级高于对话样本，可用于对对话样本训练结果的优化。

在开始配置对话模板之前，我们来明确几个概念：

特征词：特征词通常是具有一类特征的词，可用于在对话模板中匹配这一类词。举例：对于“缝补衣服”意图，用户可能会说“我想缝衣服”、“我想补衣服”、“找谁缝补衣服”，那么对应的模板中，可以设置表示缝补的特征词：缝衣服、补衣服、缝补衣服……这些词不需要作为词槽被提取出来提供给业务，仅用于约束模板的匹配，因此使用特征词而非词槽。
口语化词：口语化词将在语义解析时会被自动忽略掉，以此来提高解析的精准率。比如通用场景下：嗯我看一下明天的天气吧 --> 明天天气，这里把"嗯、我、看一下、的、吧"等口语化词都去掉了。又比如特定场景里：预定如家酒店 --> 预订如家，在定酒店的场景里省略了 “酒店”，可以将“酒店”配置为口语化的词。
模板片段：多个模板片段组成一个对话模板，每个模板片段都可以由词槽、特征词、特定文本单独或组合而成，而且多个模板片段可以是无序的，也可以是有序的。顺序设为0就表示这个模板片段可以出现在用户query中的任意位置。而非0的，必须按照数字顺序在query中出现。此外还可以设置一个模板片段是否必须在用户query中出现。
阈值：它是说当前模板配置的词槽、特征词占用户query的长度比例，当只有这个比例达到这个阈值的时候，我们才会判定用户的query就是这个模板所表示的意图。

理解了这些概念后，我们就可以从真实场景的数据中提炼相应的对话模板了。以需确认数量物品这一意图为例：

image.png

--- 参考 ---

http://ai.baidu.com/forum/topic/show/892294
https://ai.baidu.com/docs#/UNIT-v2-sample/top

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,271评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,275评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,151评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,550评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,553评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,559评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,924评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,580评论 0赞 257
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,826评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,578评论 2赞 320
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,661评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,363评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,940评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,926评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,156评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,872评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,391评论 2赞 342

实现人机对话场景的产品梳理

人机对话场景梳理的基本流程

需求分析

推荐阅读更多精彩内容