人的视觉系统是世界上最令人惊叹的东西之一,看下面这个手写的字母序列:
基本所有的人都可以毫不费力的认出上面的数字——504192,因为在人的大脑中,都有一个基础的视觉皮层,也被称为V1,它包含着大约1.4亿个神经元,在他们之前又有数百亿个连接节点。
大脑中不止有
V1
,还有 V2
,V3
,V4
,V5
,他们渐进的做更加复杂的视觉图形判断,就像我们的电脑里面有一台超级计算机,经过数亿年的不断调整,不断的适应和了解眼前的世界。认出手写数字实在是一件不值得一提的事情。几乎所有一切都在不知不觉中就完成了,所以我们通常不会在意我们的视觉系统解决了的问题有多么大。
如果想要尝试写计算机程序来认出这些手写数字,看来很容易的一件事,做起来却很难,靠直觉猜测一下我们是怎么认出这些手写数字的——“9有一个圈在顶部,垂直的一竖在右下方的位置”。这些如果用算法来表示的话,可不是三言两语就可以说清楚的,如果想要建立一些精确识别规则,可能很快就会不断的陷入意外和最后淹没在特殊情况中了,通过规则来判断看起来毫无希望。
神经网络解决这个问题的方法与此不同,核心思想就是找到巨大数量的手写数字库,比如下面的例子:
(待续)