讲师:三角兽 王宝勋博士
联系方式: wangbaoxun@trio.ai
背景介绍
Turing Test
Chat-bot
For practical bots
- 聊天是基础模块
- 聊天模块 + task completion模块 合作
Chat-bot's neighbors
- QA系统
- Factoid
- Non-factoid
- 对话系统
- 在线客服
构建聊天机器人的方法论
-
技术借鉴
- Non-factoid question answering
- Community-based question answering
- QA corpus mining from online services
- FAQ mining
** Notes: 短文本的Similarity与Relevance是不同的概念**
-
方法
- 词共现
- 机器翻译
- LDA
- Meta-data based data filtering
-
2大方向
- IR-based Framework
- Generation-based Framework
- 共同挑战:
- 聊天上下文的记忆
- 融合现有知识
- Personality
解决方案
如何度量短文本的Relevance
- word2vec, Glove
- sentence2vec
面临的挑战
- 缺乏公共数据集
- 聊天机器人的评价标准
- 现有的评估标准借鉴于MT(BLEU, ROUGE)
- 主观的评估标准很难设计
- 场景切换(上下文非常重要)
- 句子/段落的语义建模
- 知识表示与知识引用
- 生成式模型安全而无用的答案
结论
- 自动聊天系统值得研究
- 自动聊天系统会用到所有NLP技术
- 仅仅深度学习是不够的,深度学习与传统机器学习相结合
- No beer no bubbles.