卷积神经网络包括输入层、卷积层、激励层、池化层、全连接层、输出层。
1)输入层:图像数据→矩阵数据
2)卷积层:使用卷积核进行特征提取和特征映射;
卷积核:具有目标特征的特征块,一般3x3或5x5
卷积计算:使用一个卷积核,在每层像素矩阵上扫描,扫到的数值和卷积核中对应位置的数进行相乘然后相加求和,生成一个新的矩阵。超出部分补0.
3)激励层:由于卷积也是一种线性运算,因此需要增加非线性映射,通常为 ReLU layer,将输入负值变为0,输出保持原样。
4)池化层:有最大池化和平均池化,其中最大池化(max pooling)最为常用;
卷积→激励→池化的过程进行多次就构成了神经网络
5)全连接层:将输入的矩阵展开连接,按每个单元的权重,计算出最终预期值;通过调整神经网络参数,可以将误差降到最小,即训练过程。
6)输出层:用于输出结果;
优点:对高维数据处理无压力;无需手动选取特征,训练好权重,即得特征分类效果好;
缺点:需要调参,需要大样本量,训练最好要GPU