2019-03-18 基于深度学习的人脸识别技术原理

        每一个实际问题的数据解答都是通过建立并求解一个数学模型,这同样适用于人脸识别。人脸识别就是在寻找一个函数f(x)=y,对于每一张人脸x,它都可以完美找出其人脸特征值y可以理解为能够反应出这张人脸核心特征的向量,利用这组特征,可以大概率的识别出该人) ,即图像向量映射为人脸特征向量。

图像向量映射为人脸特征向量的函数模型

1 一张图片的计算机表示

        数字图像是连续的光信号经过传感器的采样在空间域上的表达。一张图像是由一个包含若干个像素点的矩形框组成的,试着把上图在“画图”软件中放大会有更直观的感受,下面是上图放大后的效果。

用“画图”软件打开放大后的图像效果图

        可以看到图像是由很多个小格子组成的,每个小格子都只有一种颜色,这是构成图像的最小单元——像素(pixel)。彩色图像的每个像素的颜色一般由红绿蓝色 (RGB)三原色叠加形成。通常情况下,RGB各有256级亮度,因此 R,G,B各占8bit,则一个像素就一共24bit。


图像的表示

2 图像灰度化

        当彩色图片RGB中的R=G=B时,就说此图片为灰度图片,注意:灰度图片也是三维的RGB,不是像黑白图的一维。

        但是在机器学习中,我们把彩图转成RGB相同的灰色图,因为三个维度一样,我们只取一个维度,这样就简化了运算,但是会丢失一些信息。

        黑色到白色之间的灰度值(grayscale),如下图:

灰度值,图片来源:https://www.jianshu.com/p/d7450d7a0902

        彩色图像转换成灰度图像最简单的方法是平均法,将同一个像素位置3个通道RGB的值进行平均。


3 什么是深度学习?

        机器学习 约等于 寻找一个数学模型来描述事物。

        深度学习和所有机器学习方法一样,是一种用数学模型对真实世界中的特定问题进行建模,以解决该领域内相似问题的过程。

        例如打麻将胡牌在数学上可以看成是

        m*AA+n*BB+p*CDE(n<=2)

        深度学习就是把计算机要学习的东西看成一大堆数据,把这些数据丢进一个复杂的、包含多个层级的数据处理网络(深度神经网络),然后检查经过这个网络处理得到的结果数据是不是符合要求——如果符合,就保留这个网络作为目标模型,如果不符合,就一次次地、锲而不舍地调整网络的参数设置,直到输出满足要求为止。

        深度学习是采用神经网络,用于解决线性不可分的问题。深度学习分为三个步骤:

        (1)建立网络架构

        (2)决定学习的目标(如误差小于x。。。)

        (3)学习,找出“最优”的模型函数 

深度学习流程,图片来源:李宏毅深度学习课程

        步骤一:定义一系列函数模型(构建网络架构)

一个神经元的构成,图片来源:李宏毅的深度学习课程

        权重和偏差就是整个网络的参数,不一样的参数就会定义出不一样的模型函数。给定一组参数,就是定义一个函数;给定一个网络架构,就是定义了一个函数集。因此把参数最佳化,就能获取比较好的结果。

          步骤二:决定学习的目标——使整体误差最小

如何评估一个函数模型的优劣,图片来源:李宏毅的深度学习课程

        为了使初始模型经过训练后成为一个能够满足我们要求的模型,我们需要准备一个训练集,这个训练集包括训练数据和标签。把所有输入经过模型后输出的误差相加,就得到了总体误差。总体误差应该越小越好,我们需要找的最优模型应该具有最小的误差,而这个模型之间误差的不同的原因在于模型中的参数不同。

        步骤三:如何获得“最优”模型?——梯度下降法

梯度下降,图片来源:李宏毅的深度学习课程

4 CNN卷积神经网络

        卷积神经网络由三部分构成:        

        -第一部分是输入层       

        -第二部分由 n 个卷积层和池化层的组合而组成的       

        -第三部分由一个全连结的多层感知机分类器构成

卷积神经网络结构图,图片来源:李宏毅CNN课程

        卷积神经网络有两大特征,一是局部连接(稀疏连接),二是权值共享(参数共享)。

        所谓局部连接,就是卷积层的节点仅仅和其前一层的部分节点相连接,只用来学习局部特征。局部感知结构的构思理念来源于动物视觉的皮层结构,其指的是动物视觉的神经元在感知外界物体的过程中起作用的只有一部分神经元。在计算机视觉中,图像中的某一块区域中,像素之间的相关性与像素之间的距离同样相关,距离较近的像素间相关性强,距离较远则相关性就比较弱,由此可见局部相关性理论也适用于计算机视觉的图像处理领域。因此,局部感知采用部分神经元接受图像信息,再通过综合全部的图像信息达到增强图像信息的目的。

        卷积层的另一大特征是权值共享,比如一个3*3的卷积核,共9个参数,它会和输入图片的不同区域作卷积,来检测相同的特征。而只有不同的卷积核才会对应不同的权值参数,来检测不同的特征。如下图所示,通过权值共享的方法,这里一共只有3组不同的权值,如果只用了局部连接的方法,共需要3*4=12个权值参数,而加上了权值共享的方法后,现在仅仅需要3个权值,更进一步地减少参数数量。


权值共享,图片来源:https://blog.csdn.net/dulingwen/article/details/83112097

5 为何CNN适合图像识别?


CNN适合图像识别的原因,图像来源:李宏毅的CNN课程

6 人脸识别模型训练

基于CNN的人脸识别模型训练流程

        假定照片为x,特征值为y,也就是说存在一个函数f(x)=y可以完美的找出照片的人脸特征值。现在我们有一个f*(x)近似函数,其中它有参数w(或者叫权重w)可以设置,例如写成f*(x;w),若有训练集x及其id标识y,设初始参数p1后,那么每次f*(x;w)得到的y`与实际标识y相比,若正确则通过,若错误则适当调整参数w,如果能够正确的调整好参数w,f*(x;w)就会与理想中的f(x)函数足够接近,我们就获得了概率上足够高准确率的f*(x;w)函数。这一过程叫做监督学习下的训练。而计算f*(x;w)值的过程因为是正常的函数运算,我们称为前向运算,而训练过程中比较y`与实际标识id值y结果后,调整参数p的过程则是反过来的,称为反向传播。(参考链接:技术角度详解人脸识别

        假设只训练甲、乙、丙三个人的图片,那么甲乙丙的照片标签向量分别可以定义为:

        甲:[1,0,0];乙:[0,1,0];丙:[0,0,1]

        假设该次输入图片为甲,最后网络输出一个3维(有多少类就输出多少维)的特征向量,如[-1,3,4],损失函数将其转换到(0~1)的概率空间,[0.1,0.2,0.7],和正确答案[1,0,0]计算损失。由于第一组参数是随机给定,首先的输出和正确答案之间肯定有很大差距。正因为此才要通过这样去反向调整参数从而去逼近正确答案,当与正确答案之间的差距足够小的时候,人脸识别模型就训练好了,训练好的人脸识别模型就可以投入实用了。

        人脸图片的二进制表示其实就是一组特征向量,只不过这个特征向量过于庞大且不好去匹配其他人脸,因此需要去冗余和泛化,提取出一组最具代表性的人脸特征来识别人脸。每经过一层网络就是特征向量的一次简化,经过一次卷积就简化一次,经过一次池化又简化一次,经过一层全连接网络又精简一次。

        其实网络层数越多,泛化能力越弱,越容易过拟合,只不过因为目前解决的问题(如人脸识别)的复杂度足够高,因此才会出现网络层数越多,性能越好的表现。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,053评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,527评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,779评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,685评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,699评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,609评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,989评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,654评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,890评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,634评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,716评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,394评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,976评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,950评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,191评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,849评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,458评论 2 342

推荐阅读更多精彩内容