image.png image.png image.png image1.png image2.png image3.png image4.png image5.png 其中face classification为人脸图像的概率:长度为2的一维向量,bbox是回归框的信息:长度为4的一维向量,facial landmark是关键点的位置:长度为10的一维向量。 pnet网络没有对卷积层的输出作平滑处理,1132不是通常的平滑层,主要是因为实际应用时输入图像尺寸不一,若使用flat层,即平滑层每次输出的特征的尺寸也是大小不一的,利用卷积层时,可以让输入大小不一的图像输出维度不一的特征向量。 image.png image.png image3.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png