据IDC数据显示,2019年,我国语音语义应用市场规模达1224.9百万美元。比如,科大讯飞、阿里、腾讯等纷纷布局智能语音,产品广泛应用于智慧教育、智慧汽车、智慧医疗等多个领域。从商用价值以及数据价值来讲,语音正成为新的风口。
以游戏化的用户体验,让人人乐于参与;
以积分激励的方式,完成数据梳理。
在今年5月份,市场上悄然出现了的一个区块链游戏化知识图谱协作平台,让语音库这种枯燥而繁杂的工作变为有趣的游戏,并正在引起小范围并持续扩大的关注。这就是 EpiK 铭识协议旗下的知识图谱数据采集应用「知识大陆」,通过游戏化形式组织其全球社区成员共建大规模开放知识图谱数据库。
知识大陆以“人类文明毁灭后重建”为故事背景,让玩家通过语音答题的方式恢复人类科技,帮人类寻找迷失的知识,从而体验从从远古文明走向农业时代、蒸汽时代、现代文明和未来太空时代等发展场景,使得处理语音库这种枯燥而繁杂的工作,变成一种探索人类文明的有趣游戏。
据资深玩家介绍,在知识大陆的奖励逻辑中,有一个“资金池”,而奖励基金每天都会注入一定资金进入到“资金池”,而且分小时均匀注入。测试阶段每天瓜分500个EPK奖励(当前EPK市价2.1元),EpiK主网上线后每天预估将有3万个EPK奖励,奖励丰厚。除此之外,用户在知识大陆上语音答题,邀请好友注册并答题,皆可获得的积分奖励,该积分可通过应用中的探险功能兑换为EPK。根据已参与内部测试的资深用户透露,在其一个月的体验中,在知识大陆账户已有累计获得近4万积分,272个EPK,按照目前价格估算,价值8000余元。
据了解,知识大陆这款应用是由EpiK铭识协议提出,后者是一个致力于打造一个去中心化的共建共享共益的安全可信知识图谱协作平台,其愿景是将人类各领域知识转化为知识图谱永久保存,开阔 AI 的认知,推动认知智能时代的到来。
EpiK铭识协议为什么要推出知识大陆?知识大陆这款产品的定位是什么?使用场景有哪些?作为首个协作语音库项目,参与知识大陆贡献的数据意义是什么?…… 正在引起圈内人士的讨论。
EpiK铭识协议为什么要推出知识大陆?
众所周知,构建知识图谱是一个非常复杂的过程,需要大量的数据作为支撑,知识图谱数据的挖掘、采集和结构化也是非常大的工作量。在 EpiK 铭识所搭建的知识图谱生态中,由领域专家和赏金猎人这样的角色来完成这些工作,并设想通过开发出知识大陆这样的知识图谱数据采集应用,通过游戏化形式组织全球社区成员共建大规模开放知识图谱数据库。
知识大陆是开放性知识生态的一个缩影,是EpiK生态工具产品的一个案例。如果将EpiK知识生态比作一所房子的话,知识大陆只是其中一间样板房。为了更高效、更大规模地协作,EpiK目前也正在和多家知名数据标注公司合作,共同助力开放知识生态的构建。
维基百科是一个开放的知识数据库平台,各类人群均可通过对内容编辑而为这个数据贡献力量。那么知识大陆是一个基于游戏化、去中心化的知识图谱众包平台,一个工具性的产品,用来协助项目进行数据收集及整理。
其实知识大陆的定位,是可以千变万化的,可以根据不同行业的设定需求化身不同的表现形式,渗透到不同行业领域当中,包括金融、医药、法律、社交、电商等各个行业,随着知识大陆的发展和运用,到了中后期,这些面临行业痛点的有数据需求的公司,都可以选择和知识大陆合作,共同协作收集整理并处理数据。
目前来看,知识大陆的机制相对比较简单,基本没有设置门槛限制,任何人在任何空闲时刻,例如吃饭、休息、甚至上厕所的时间,都可以通过知识大陆玩知识小游戏参与数据贡献并获得奖励。知识大陆的应用场景,丰富程度,堪称宝藏。
知识大陆首个协作语音库项目,正以每天超过1G的有效数据量持续增加
据透露,知识大陆的该语音库项目,是来自于一家语音数据公司的委托。事实上,当前不少巨头公司都对EpiK铭识协议知识图谱构建模式表示关注,知识大陆语音库项目只是其中的项目之一。语音库仅仅是知识大陆的一个重要方向,知识大陆是EpiK知识生态工具,助力项目知识数据的采集与整理,仅仅是其中的一个案例。面对人类知识的形态万千,知识大陆语音库也仅仅是其中的一个样板,未来知识大陆会推出更多的知识库样板。
知识大陆,作为数据采集员的角色,它可以变身不同的形态,领域专家和赏金猎人也可以通过不同的场景来变换角色。比如说,知识大陆可以融入游戏中,根据AI公司的需求,游戏公司化身领域专家的角色,设立不同的任务或问题,而玩家完成后任务和问题后可以获得相关道具或者金币,游戏公司的报酬便是EPK奖励。
可以发现,在这个过程中的三个角色,都可以做到共赢:AI公司得到了想要的数据,可以研发出更智能的AI应用;APP 玩家得到了想要的道具或金币奖励,有了更好的游戏体验;游戏公司得到了想要的开发资金。
其中,游戏公司得到了想要的开发资金,尤为重要。当前国内乃至全世界小型的游戏开发公司或团队都会面临资金难关,开发游戏又是一个特别烧钱的项目,而在获得外界投资之前,游戏公司的变现能力相当有限,只能通过一些影响游戏体验性的方式来获得开发资金,比如说广告,这是玩家们在玩各种游戏的时候,都有的深刻体会。
当前,知识大陆已经内部测试1个月,通过技能简单的认证用户,超过3000人,答题用户数近1700人,而总计答题数量高达135万+,累计高质量中文语音数据超 8G+。 这些数据,仍在不断累加中。
公开测试1个月,数据成长方式有效,将推出知识勋章NFT
据官方公示的知识大陆采集情况看,其数据维度、条数、地域覆盖度已全面超越全球最大的开源语音项目 Mozilla Common Voice。Mozilla 是一个自由软件社区,由 Netscape 的成员于 1998 年创立。20余年里, Mozilla 社区使用、开发、传播和支持 Mozilla 产品,从而推广免费软件和开放标准。Mozilla Common Voice 项目的中文语音采集量,仅仅在两周内,就被知识大陆所超过。
业内人士评价,知识大陆之所以能如此快超过Mozilla的中文语音数据库,是因为解决了采集数据的最大痛点,即激励。他经济模型使得各方都有丰厚收益从而使大规模多样化采集成为可能。
随着知识大陆语音库内容的不断增加,据最新版本的知识大陆的官方预告,将增加知识NFT勋章功能,在后续将可以参加主网EpiK的挖矿活动。同时,在NFT加入后,整体将增加更多玩法,吸引更多玩家和相关公司参与进来,和EpiK铭识协议一道,共建共享人类永恒知识库。