论文阅读:Deep Ordinal Regression Network for Monocular Depth Estimation

论文地址:[1806.02446] Deep Ordinal Regression Network for Monocular Depth Estimation

概述

Monocular depth estimation (MDE), 从理论上是一个病态的问题,近年来的工作利用 deep convolutional neural networks (DCNN) 提取 image-level information 及 hierarchical features 在 MDE 问题上取得了巨大的提升。这些方法把 MDE 视为一种 regression problem,并把 mean squared error (MSE) 作为 regression loss,MSE 的显著缺点是收敛速度慢且容易陷入局部极值。因此,Huan Fu 等人提出一种基于 ordinal regression的方法解决 MDE 问题,即 deep ordinal regression network (DORN)。

这篇文章的主要贡献包括:

(1)引入 ordinal regression 处理 MSE 问题,并采用 spacing-increasing discretization (SID) 方法量化深度

(2)采用 dilated/atrous convolution 提高 feature map 分辨率

(3)设计一种 full-image encoder 并结合 atrous spatial pyramid pooling (ASSP) 作为 scene understanding 模块

网络结构

网络结构,图片引自原文

输入图片经由 dense feature extractor (resnet 101) 提取 feature map F,并送入三个分支,full-image encoder,cross-channel learner (绿色 Conv) 和 ASSP ,其结果在 channel 上 concatenate,此 feature map 经过 kernel size 为1的卷积 point-wise regress,其结果经过 softmax 转化为概率形式,train 过程中计算 ordinal regression loss,inference 阶段采用另外一种形式获得 prediction 结果。

Full-image encoder

假设 feature map F 为 (B, C, W, H) 结构,首先进行 window size 为k的 average pooling,后接 fully connected layer (fc) 并输出C维向量,视其 (B, C, 1, 1) 的 tensor,broadcast 为 (B, C, W, H) 即原 feature map 尺寸。

Spacing-increasing discretization

SID 的动机是在实际任务中,depth 越大,对其估计误差的容忍就越大,因此对 depth 取 log 后均匀量化可以满足这个目的,具体地:


量化公式,引自原文

UD为 uniform discretization 均匀量化,其中t为量化阈值,i为量化阶,alpha 和 beta 是 depth 上下界限,为了避免除0,depth 需要加上一个 shift 以保证 alpha 为1,量化阶的总数记为K

Ordinal Regression

ordinal regression 在 train 与 inference 过程中 predict 的方式不同

ordinal regression loss的计算,引自原文

其中L为 loss,l(w,h) 表示在 (w, h) 点的 depth,不加 hat 为 ground truth,否则为 predict (但这只是概念上的),N为W与H的乘积。

可以采用下述流程计算:

假设 scene understanding module 的输出为 (B, C, W, H),首先通过 kernel 为1的卷积得到 (B, 2K, W, H),reshape 为 (B, 2, K, W, H) 并在 axis=1 上计算 softmax 获得 (B, 2, K, W, H) 的 tensor,axis=1 上,取0表示:batch 内b图片在 feature map 的 (w, h) 位置上的特征点进行预测,其关联的 depth (ground truth depth) 量化后的数值不大于k的概率,取1表示大于k的概率。对预测结果 tensor (B, 2, K, W, H) 只取大于k的概率,得到 tensor (B, K, W, H),记为y,loss = sum( - log(ay + b)),其中a可以通过如下方式获得,假设点 (b, w, h) 所对应的 depth 量化为k,这样生成一个长度为K的向量,其0...k-1的元素都为1,k及之后为-1,由于共有(B, W, H)个这样的向量,因此可以组成 tensor a,shape 与 y一致,b的生成方式类似a,不过其0...k-1的元素都为0,k及之后为1。

inference 时,对点 (b, w, h),只需要计算向量 (b, :, w, h) 中大于0.5的元素个数即可获得预测 depth 的量化值

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,539评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,911评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,337评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,723评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,795评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,762评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,742评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,508评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,954评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,247评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,404评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,104评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,736评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,352评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,557评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,371评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,292评论 2 352

推荐阅读更多精彩内容

  • 我不高攀有钱人,因为我花不到他的钱,我不小瞧穷人,因为他不靠我生存,我不巴结有权人,因为他不会白给你帮忙。我不奉承...
    合缘阅读 176评论 0 0
  • 麻城龟峰山 你是人间的四月天 文/南湘紫 01 四月 已过 可我 还是想念 想念你娇艳的容颜 山花欲燃 那是杜鹃...
    南湘紫阅读 1,037评论 79 30
  • 一个学生问老师说:“古人为什么特别重视‘知行合一’?”老师说:“因为,只有‘行’才能对‘知’有真切的感悟。”学生没...
    海王星1984阅读 152评论 0 0
  • 奔跑 必须最快到达 跳跃 以箭的速度 猎场 就是厮杀 防备 危险随时出现 小心 陷阱就在眼前 现在 没人能救我 怯...
    巫师小白阅读 428评论 0 3