百度输入法8.0版本发布会后的“观后感”

人工智能发展六十年,几起几落,如今迎来又一次热潮,深度学习、计算机视觉和自然语言理解等各方面的突破,使得许多曾是天方夜谭的应用成为可能,智能人机交互就是其中之一。作为人工智能的底层技术在语音识别、图像识别的延伸与应用,全感官输入方式的人机交互方案近几年内受到了密切关注。

8.0版本中涉及到的人工智能技术其实并不新鲜,早在人工智能概念兴起的之前,就有了语音识别等一系列的技术。但是百度输入法真正实现突破,原因主要有两方面:一是技术,语音识别在过去只有很低的识别准确率,过去的不可能现在变为可能。华少现场挑战426个字速度,其中还包括一些难以识别的词句,百度输入法全部识别准确,同时还现场演示了语音速记的功能,结合百度输入法之前的版本功能,现在百度输入法具备声纹识别、轻声识别、识别准确率高、语音速记、语音指令控制的特点。二是理解用户需求,输入法围绕着基础输入的功能,拓展了“语音翻译”、“语音速记”、“AR表情包”,更贴近用户的使用习惯,丰富了用户场景。AI助力,将更难的产品需求实现,实现全感官的智能人机交互方式。

 |  产品新功能介绍

发布会亮点展示,一项技术突破(DeepPeak2模型)和两项功能(语音速记+AR表情)。

百度语音技术的最新突破——DeepPeak2模型,该技术全称为“基于LSTM和CTC的上下文无关音素组合建模”,该模型突破了沿用十几年的传统模型,能够更充分地发挥神经网络模型的参数优势,大幅提升中英文、多种口音、多种风格(如朗读、聊天、轻声)混合输入的识别准确率,聊天场景下的相对正确率较行业领先水平提升20%,在语音输入位占据主要的输入方式的时代,这种新的技术能更适应用户的自然语言对话,提升了用户体验。


百度语音部门总监高亮在介绍技术模型

语音识别新功能——“语音速记”,分为单人和针对2-3人的小型会议场景,可根据声纹区分不同发言人的语音信息并整理,这将节省很多的时间。


现场演示多人的语音速记功能

斗图功能——“AR表情”,运用了人脸识别技术和AR技术,用户可以通过相机或相册进行人脸识别、制作表情包,还可以用自己的表情控制虚拟人物的形象。用户制作出来的AR表情,可以直接通过输入法搜索、语音输入和键盘输入时展示出来。


AR表情

 |  产品体验,语音速记+AR表情

高效输入:语音是全感官输入的第一步也是很重要的一步,DeepPeak2技术模型带来的是语音输入中高速、便捷的体验,还优化了口语与朗读混合和中英文混合的体验,打磨了产品的核心能力。

智能记录:在人工智能技术的支持下,语音识别的场景也开始拓展满足更多用户的需求。声纹识别、识别准确率高、快语速记录的特点能够满足小型会议、课堂记录、采访等多种需求。

表情功能:AR表情满足了占据着百度输入法70%的90后用户对于表情的拓展需求。在体验中AR表情可以浏览的与面部表情结合起来发送到社交软件。

|   产品建议

产品功能优化建议:

1.语音速记:2-3人的小型会议从一开始需要选择2人或3人,面对较复杂的用户场景如中途加入、4上以上就无法满足。速记对英文识别不是很流畅,体验较差。

2.AR表情的功能,已经的APP能够为用户制作出类似的表情包且能够提供的特效比百度输入法更多,所以丰富特效是增强AR表情包使用率的办法。

产品设计细节建议:

1.多人语音速记中,修改人物名称需要点击人物才可以,用户在探索该功能时可能会花费一定的时间,建议增加功能入口如设置选项。

2.语音文件中只有图标去确认单人/多人语音文件,建议在文件名后生产单人/多人文件标识。

产品设计方面更新建议:

这是百度输入法的8.0版本,也是全感官输入的1.0版本,通过全感官可以完成更高效的表达。所以设想的功能如下

核心输入功能:语音全称控制输入,无需触摸使用。通过简单的手势+面部表情输入可以实现一些常用且简单的交互方式。

拓展功能:与百度翻译,百度识图等深入合作,拓展更多输入方式,丰富用户场景,增强产品能力。



这篇文章是我在参加了百度输入法8.0版的发布会现场后写下的,文章有些地方写的不是很好请指正,非常感谢。


©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,098评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,213评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,960评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,519评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,512评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,533评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,914评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,804评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,563评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,644评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,350评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,933评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,908评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,146评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,847评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,361评论 2 342

推荐阅读更多精彩内容