摘要:目前,同时定位与地图构建(SLAM)技术在真实环境中的应用仍受多种因素制约,室内环境中的动态对象干扰就是其 中一个亟待解决的问题。 提出一种基于 ORB-SLAM3 并以实例分割网络为辅助的视觉 SLAM 系统,该系统将分割任务置于后 端,在前端结合 RGB-D 相机输入和核相关滤波(KCF)算法对后端检测到的语义信息进行跟踪传递,并且使用语义信息在贝叶 斯概率框架中追踪关键点的运动状态。 与目前基于检测或分割的方法相比,该系统使用更为轻量化的方案来分割和跟踪场景 中的运动对象,并在贝叶斯滤波模型的进一步辅助下,既实现了准确的动态干扰滤除,又优化了卷积神经网络(CNN)预处理导 致的系统运行实时性问题。 在 TUM RGB-D 数据集上的实验表明,该系统能以约 16 fps 的速度取得较高的定位精度,相较于 ORB-SLAM3 平均领先 78. 56% ,相较于 DynaSLAM 平均领先 11. 85% 。