论文标题:LiDAR R-CNN: An Efficient and Universal 3D Object Detector
cvpr2021,图森乃严大佬组出品。
文章主要探讨了3d目标检测中的proposal尺寸模糊问题,作者提出了两种即插即用的方案来对于proposal进行优化,文章并没有提出一种新的网络架构。不过我觉得这种行文方式和探讨问题的方法是值得我们学习的。
老规矩,上图!
首先作者对于目标检测器(pointrcnn pointpillar)等提出的proposal进行7d的优化,首先将他们的尺寸进行一个扩大,随后建立一个local的坐标系。主要操作类似于之前的文章,就是坐标中心化,同时对于axis进行一个proposal方向的对齐。
随后将point输入到backbone中,可以看到backbone也是一个很轻很简单的操作,这样操作当然是为了快速的推理。
随后作者进行了实验kitti及waymo上进行。
在单类别和多类别的实验上,都取得了不错的效果。
占据内存也不大