240 发简信
IP属地:广东
  • @Congc_fdd6 谢谢,4倍下采样后,特征图的HW也有128*128,物体在特征图的大小假设是h=50,w=20,我还是觉得能feanture map能直接输出这么大的数字很不可思议

    CenterNet:Objects as Points

    整体信息: 这篇文章题目言简意赅,就非常吸引人眼球。不同于CornerNet预测一对角点得到bbox,以及基于CornerNet改进的CenterNet预测三个点得到bbo...

  • “而目标的长和宽是经过对应当前中心点的w和h回归得到的。”
    你的意思是预测顺序是 原图->热力点->中心点->w,h? 但是最后output通道里同时包含heatmap和w,h的呀,通道size也一致,说明heatmap中任何一个坐标都有其对应的w,h值,并不是回归中心点得到的,中心点的坐标并没有先验性地参与w,h的计算,它们是同时得到的。 还有,w,h真的可以直接在输出特征图里显示地表达吗?w,h一般是几十几百大数字,而神经网络的输出一般是小数字,跟我意识里的神经网络相差很大。在VOC数据集中有没有分别统计大中小目标的准确率呢?

    CenterNet:Objects as Points

    整体信息: 这篇文章题目言简意赅,就非常吸引人眼球。不同于CornerNet预测一对角点得到bbox,以及基于CornerNet改进的CenterNet预测三个点得到bbo...

  • 网络的实际输出是热力图上的每个类别的峰值,这与PoseNet以及其他所有的姿态检测网络类似,但当我们知道了这些峰值之后,如何回归出需要的box呢?
    做法是将热力图上的所有响应点与其连接的8个临近点进行比较,如果该点响应值大于或等于其八个临近点值则保留,最后我们保留所有满足之前要求的前100个峰值点。
    (这里还是没说清楚怎么从100个峰值点回归出宽高的啊)

    CenterNet网络精读与分析

    近期CVPR2019的最新论文CenterNet在一篇文章中就提出了一个能够解决目标检测、姿态检测、3D单目检测的掉炸天网络,一时间激起来了千层波浪。这几乎是未来目标检测一个...