tags: 单目深度估计,论文阅读,DORN
[TOC]
原始论文是:
Deep Ordinal Regression Network for Monocular Depth Estimation Deep Ordinal Regression Network for Monocular Depth Estimation
Huan Fu1 Mingming Gong2,3 Chaohui Wang4 Kayhan Batmanghelich2 Dacheng Tao1 Huan Fu1 Mingming Gong2,3 Chaohui Wang4 Kayhan Batmanghelich2 Dacheng Tao1
过往的工作(特指那些 使用 深度 神经网络的:DCNN)方法的3种失败处:
- 收敛慢
- 局部解析度不够,就是你在最后的深度图上,看不清很多边缘
- 网络里面 有许多 重复的 pooling 操作。计算,内存要求多
我们提出一些方法来针对上述问题
方法1: SID
背后的想法就是: 远处的就分类粒度粗一些
那么,在这个 「SID 远处的就分类粒度粗一些 」的基础上,就能把回归问题 变成 一个 分类问题。
离散化 连续 的 距离 变为 一些 距离间隔。
我们的模型包含什么
分成3个模块
- 特征提取的模块
- 场景理解的模块
- 有序回归的模块
特征提取模块
包含:
全面的图片编码器
full-image encoder
场景理解模块
ASPP
空洞卷积??
有序回归 模块
这里就是 用到 了SID
如何完成学习和推断
学习阶段
定义我们特有的损失函数:
迭代的优化算法,反向传播 ,我们最后就能得到一个 「有序的 label 分类」,每个类就是一个距离,比如:1m, 1.1m, 1.2m, 1.4m, 2m, 10m, 50m; 这个距离 跟上面 的SID 有关。
推断阶段
有了 : 有序的 label 分类, 就可以进行 距离推断。
用下面的公式:
- 解释一下:
d 尖就是 推测的 depth/ 距离
l 就是 学习到 的label
DORN 的表现很好
在18 年的原始论文里,有这个数据:
在 21年的 kitti 排行榜,很靠前
其实,按照 absRel , DORN 排名第一