1、单位M:是指参数的数量,即一个模型包含多少个参数。10的6次方
2、单位MB(MByte的缩写):指一个模型的大小,即模型所占存储空间。
3、结论1:改变num_classes,参数量会发生变化,但是变化很小,不影响。
4、结论2:对目前所看到的语义分割相关的文章中可以发现,对于一个语义分割任务,首先会通过一个backbone获得一个分辨率较小的图(很多论文都会提到output stride,即输入图像尺寸经过一个网络后的尺寸的大小的比例),再对这个分辨率较小的图进行一些利用上下文语义信息的处理。
5、结论3:backbone的用途。backbone的任务不仅仅适用于语义分割,最早适用于分类网路的,同时在各种计算机视觉的任务中都是基本操作。由此,诞生了一些重要的网络,例如残差的resnet,轻量级的googlenet,vgg等等,同时也包括这篇HRNet。对于上下文语义处理的步骤,最早也是出现了包括deeplab和pspnet两个经典的方法,后面也有利用注意力机制的no-local和ccnet等等。包括和HRNet搭配使用的这个OCR。
https://zhuanlan.zhihu.com/p/307354697