摘要:针对当前基于锚的双目 3D 目标检测算法存在的锚点数量选取较多,从而影响在线计算速度的问题,提出了一种基于 Stereo RCNN 的锚引导 3D 目标检测算法 FGAS RCNN。 在第 1 阶段中,输入左右图像分别生成相应的概率图以生成稀疏锚点及 稀疏锚框,再通过将左右锚作为一个整体生成 2D 预选框。 第 2 阶段的关键点生成网络利用稀疏锚点信息生成关键点热图,并 结合立体回归器融合生成 3D 预选框。 针对原始图像在卷积后会出现像素级信息丢失的问题,通过 Mask Branch 生成的实例分 割掩模结合实例级视差估计进行像素级优化。 实验表明,在没有任何深度和位置先验信息输入的情况下,此方法依旧可以在减 少计算量的同时保持较高的召回率。 具体来说,此方法在以 0. 7 为阈值的 3D 目标检测上平均精度为 44. 07% 。 相比于 Stereo RCNN,本文方法在平均精度上提高了 4. 5% 。 与此同时,此方法的整体运行时间较 Stereo RCNN 缩短了 0. 09 s。