2016年12月,在AlaphaGo战胜世界围棋冠军李世石的9个月后,“人工智能”的风潮已经势如破竹般席卷全球,在这一领域里几乎任何科技的进展,媒体们都喜欢把它包装成为人工智能技术的较大进步;以“机器将要代替人力”为主的AI威胁论也在不断引发学术界和科技界的讨论,仿佛科幻电影中的未来世界很快将要来临一样。
让我们拨开一层层的迷雾来一看究竟,现今,人工智能将转变很多产业,但它不是万能的魔法,电影中的科幻场景离现实中的AI相距甚远,哪怕是未来几十年后,也未必能够看到它们的实现。
开始写作这个专栏,就是期望暂时不要被夸大事实的媒体所影响,真正来了解我们身边的人工智能产品,看看AI在今天究竟能做些什么;对不同的行业和业务,会带来怎样的影响和转变;想在一领域创业的伙伴们,应该如何探索新的机会……
本着学习的心态,务实的态度,理性的思考,大胆的推断,也许人工智能的市场如汪洋般浩瀚,但我们也要从中找出那一根可以落地的尖针。这就是智能时代我们想要不断探索实现的目标。
下面我们先来谈一谈,现阶段人工智能的主要形式——监督学习。
所谓监督学习,形象来讲,是指我们把已经知道的知识教给机器,让机器设计出一个模型,然后“举一反三”。举个例子,比如我们已经知道英语如何翻译成中文,于是拿了大量的英翻中的句子训练机器,直到机器“学会”了如何翻译,这时再把新的英语句子输入给机器,它就能够正确地输出翻译结果,这就是监督学习。
与之相对应的,叫无监督学习。我们有问题,但不知道答案,于是交给机器,它们按照问题的性质自动分成很多类别,每一类的问题都相类似(专业术语叫做聚类)。比如Google新闻,每天会搜集大量的新闻,然后把它们全部聚类,就会自动分成娱乐、科技、政治等几十个不同的类别,每个类别内的新闻都具有相似的内容结构,这就是无监督学习。
介于以上二者之间的,叫半监督学习,即有一部分问题我们知道答案,另一部分则不知道,且不知道的部分可能大于知道的部分。这就要求机器在我们引导的情况下,通过已知的部分推测未知的部分,找到较好的分类结果。
我们目前能接触到的人工智能还处于初级阶段,几乎都是监督学习模式:即输入数据(A)然后快速生成简单的回应(B)来完成。比如面部识别可以先用海量的图片训练机器识别人脸,当再次给出新图片时,它能够正确识别出人脸及长相;同理,语音识别就是用大量声音片段训练机器转译成文本,之后当再给机器新的声音时,它能够正确把语音转换文本。
这些技术听上去很简单,但这些仅靠输入A和输出B的应用已经在改变许多产业,比如Google Translate对翻译行业带来冲击,语音助手对搜索行业将产生影响,智能问答机器人对客服行业的颠覆等等,因为它背后的基础研究是前面几十年的结果。未来随着科技的进步,当半监督学习和无监督学习技术越来越成熟时,我们将能够借助人工智能解决更多难题。
小结:
今天我们讲了监督学习、无监督学习和半监督学习,以及介绍了目前大多数的人工智能都属于从A->B的监督学习模式。
你所在的行业中,有符合从A->B模式的例子吗?或许你可以尝试用人工智能的思维来解决其中的问题。
预告:
下一篇文章,我们会介绍人工智能的两大核心:数据和算法,如果你感兴趣,请留意关注微信公众号:智能加研究院