当下最火的概念无非就是人工智能了,现在,人工智能已经渗透,到了各行各业,也渗透到了我们生活的每一个角落,和别人聊天的时候,如果说你没有听过人工智能,那估计就会成为被人鄙视的对象了。
然而,作为一个门外汉,我一直对人工智能,大数据等概念知其然却不知其所以然。好像对它们很熟悉,可是细细一想,却又发现对它们其实所知甚少,基本停留在人云亦云的阶段。
巧合之下,看了吴军老师写的《数学之美》这本书,总算对人工智能,特别是电脑对自然语言的处理有了一点了解。今天写出来分享一下,以一个外行加菜鸟的身份谈谈个人的理解。
在最一开始,科学家们觉得要想让电脑理解人类的语言,那就需要像培养一个婴儿学习语言那样去培养它,概括起来就是两件事:分析语句和获取语义。可是,对我们人类来说很简单的问题到了电脑这边就变得无比艰难,因为电脑没有办法理解一个句子或一个单词和上下文的关系,再加上有那么多的多音字,多意字等,对于电脑来说,运算量实在太过巨大,即使今天计算机的运算能力有了突飞猛进的发展,就拿现在的英特尔i7处理器来说,分析一个二三十个单词的句子也要花一两分钟,可想而知,这条路是完全行不通的。
后来,科学家们发现利用数学上的概率算法可以解决这个问题,创建了统计语言模型,人工智能的春天才算来临,简单来说,看一个句子是否正确合理,只要看它的可能性大小如何就行了,而可能性的大小可以用概率来表示,假设组成一个句子的单词有n种排列方法,只要看哪种排列方法的概率最大,那这个句子的准确性就最高。打个比方“小明在吃饭”这个句子,里面的每个字有多种组合方式,像“饭吃明小在”等,而对比各个排列顺序在一个大的数据库里面出现的概率,就能筛选出“小明在吃饭”这个正确的句子。
我觉得最伟大的不在于这个方法翻译了多少句子,而是为人类打开了一扇新的大门,原来用数学的方法也能解决语言的问题。在这种思维方式的引领下,人工智能的浪潮才能来到我们身边。
另外,我也总算了解了一点人工智能和大数据的关系,给电脑设计出一套算法后,它一定需要大量的数据来支撑这套算法,而这套算法会自动进化,不断寻找最优的解决方案。看过一个例子,研究人员给电脑设计了一套自我学习的算法,然后就让电脑自己去玩游戏,前面几次,电脑都会有大量的失误,可是短短半个小时后,电脑的失误比率就降到了百万分之一,两个小时后,电脑发现了一个bug,可以直接打碎一堵墙获得胜利,而这个漏洞人类玩家花了很长时间也没有发现过。
以后我会陆陆续续把自己的一些学习心得写下来和大家分享,这也能够帮助自己个更好的了解阅读到的东西,一个知识,只有当你能够用自己的理解说给别人听,才算真正的了解。