1 。 mmdet中的 core/ evalution/ classnames.py 中的类别没修改
2 。mmdet 中的 datasets/ voc.py 中的类别没修改
3 。config/ base/models 中基础模型的 num_classes 没有修改正确
4 。config/ faster_rcnn.../...py 中 datasets的路径 没有修改
5 。图片的标签 (xml) 中含有其他类别,比如训练类别只有 a ,但是标签里面有 a, b, c。
6。 学习率过高
总结:
如果nan的情况是间断性出现的,比如前面几个 batch 的loss正常下降,突然有几个batch的loss变成nan ,然后loss又正常了,就是前面5中情况中的一种,大概率是情况5.
如果nan的情况不是间断性出现的,比如前面几个batch 的loss正常下降,突然持续变成nan,不恢复正常,则有可能是情况6,在 schedule1x.py 中把learning_rate 调至它的0.1倍。