论文笔记:BaMVO

Effective Background Model-Based RGB-D Dense Visual Odometry in a Dynamic Environment

动态环境下基于有效背景模型的三维稠密视觉里程计

摘要:

本文提出了一种基于背景模型的鲁棒密集视觉里程计算法，该算法在动态环境中使用了一个RGB-D传感器。该算法从深度场景中估计非参数模型表示的背景模型，然后基于估计的背景模型使用基于能量的稠密视觉里程计方法来估计传感器的自我运动，以考虑运动物体。实验结果表明，在动态环境下，BaMVO能够鲁棒地获得自我运动。

深度场景中估计非参数模型表示背景模型，用背景模型和基于能量？估计传感器自我运动

I.介绍

本文提出了一种基于背景模型的基于RGB-D传感器的稠密视觉里程计(BaMVO)算法，用于动态环境下的鲁棒导航。对于动态环境下的视觉里程计计算，考虑了背景模型来减小运动目标的影响。为了对背景模型进行估计，本文采用了一种主要用于背景减法领域的非参数模型[20]。然而，对于运动相机的图像，由于相机的自我运动是未知的，使用背景减法提取异常运动是困难的。在此基础上，利用深度场景计算背景模型，同时对传感器的自运动进行估计，并用非参数模型表示背景模型。最后，应用基于能量的DVO方法计算了基于估计背景模式的自运动

II.算法原理：基于背景模型的稠密视觉里程计算法

A.初始化

x=(x,y)为像素坐标
3d点： $p_k=(X_k,Y_k,Z_k,1)^T$
像素深度： $Z_k(x)$
颜色信息: $\tau$
针孔相机模型:
- 2维转为3D点： $\pi^{-1}()$
- 3D点转为2维： $\pi()$
欧几里得变换表示相机位姿变换：
李群李代数：

B.深度图变换

背景模型是通过累计深度差值来计算的。但是不能通过移动的RGB-D相机的连续序列直接获得，因为图像的视角在不断变换。

下面将K-1帧深度图像变换到第k帧位姿下：

变换之后做图像差值：

背景模型就定义为当前深度图像与其重映射深度图像之间差异图像。

C.背景模型估计

本节介绍如果结余非参数模型，从深度场景中估计背景模型：

将深度图像变换到和前一帧图像的相同坐标系下，计算出差分图像 $D_n$
背景概率密度函数 $W_{B,k}$ 可以对每个像素分别进行非参数估计。

其中 $\sigma_z(x)$ 是深度图像每个像素的偏差，N是深度图像大小。

该算法从一开始就假设RGB-D传感器在N帧内没有运动，为了减少这种假设的负面影响，在考虑估计误差的情况下，应该将存储的深度图像的数量设置的尽可能低，作者设置为N

由于RGB-D传感器的干涉孔位置随时间的不同而变化，连续变换的深度图像之间存在较大的跳动。由于存储的深度图像之间的点不对应，也会出现这种情况。

这一段没读懂

偏差σZ (x)是使用图像中的所有像素的深度的平均绝对偏差估计的：

这里是每个像素一个偏差，计算中用到的是第k-n个到第k个图像差分的像素x的均值。

C 是常数比例因子， $\Phi$ 是累积分布函数。

定义背景图像 $B_k(x)$
为了确定背景阈值，(8)和(9)与每帧的动态目标速度 $v_d$ 相结合:
$v_d$ 95%的置信区间(CI)为：
$v_d=1.96\sigma_r$ 其中 $\sigma_r$ 是深度差分布的标准差，图3是深度差的概率密度函数，作者说静态环境中固定的RGB-D传感器的 $\sigma_r$ 为16.23，然后就获得了想图4(d)一样的有标记的背景图像