[笔记]Dense Pose Transfer

原文链接

简介
Facebook research的团队在他们发表的DensePose系统的基础上尝试了姿态迁移的工作,使用2D->3D的方法实现为图像中的人生成不同姿态下的外观。实验效果显示,在定量比较上,Dense Pose Transfer比现在的一些基于二维平面姿态估计的生成方法要好。
Dense Pose Estimation 简介
Dense Pose Estimation可以实时将2D图像中的人转换为3D人体模型,这项成果已经作为CVPR2018的oral论文发表。

Dense Pose Estimation

如上图所示,DensePose系统将人体的3D表面模型切分为24个部分,然后为每一部分构建一个UV坐标系,将2D图像上的人体部分的每一个点映射到相应的3D表面部分。具体效果如下图所示:
Dense Pose Estimation效果

Dense Pose Transfer 整体框架

Dense Pose Transfer 整体框架

  从上图可以看到,整个框架主要包括3个模块:predictive module , warping module ,blending module . 在给定一个源图片和目标图片的情况下,使用DensePose来估计源图片和目标图片中的人体姿态,然后将其输出作为Dense Pose Transfer模型的输入。预测模块生成较为模糊的图像,但保留了大致的体型,头发,性别等信息;变形模块则更多的关注于对纹理的预测。最后将两个模块的输出作为混合模块(blending module)的输入,混合模块结合两者的优点,生成最终的结果。

Predictive stream
  预测模块主要是一个使用DensePose系统的输出来做姿态迁移的条件生成模型。现有的模型将目标姿态用关键节点的热力图表示或者用小火柴人的形式来表示。本文将源图片和DensePose系统对源图片和目标图片提取的DensePose的结果直接相连作为输入,得到一个256 x 256 x 9的输入。然后,输入的数据通过3个卷积层,得到64 x 64 x 256的feature map,随后通过6个残差块,还有两个转置卷积层和一个卷积层,得到最终的Predicted Image。

Warping stream
  Warping模块主要是通过在共同的表面 UV坐标将输入图片的纹理贴图到目标图片中。这个模块的核心是STN(Spatial Transformer Network) 。 DensePose将人体的3D模型分割为24个部分,STN根据DensePose的输出将源图片的人物对齐到24个部分的UV坐标系中,然后在每个UV坐标系中进行插值。然后用另一个STN模块从UV坐标系转换到输出图片。但是直接这样做效果不好,因为源图中包含的人体信息一般不能覆盖整个人体,而且跟目标图片中的人体外表的重合部分一般比较少,所以研究者们在这个warping模块中加上了一个修复网络(inpainting network):

inpainting network

  inpainting模块主要是从STN模块填充的人体表面节点推断人体剩余部分的外表。因为系统不能得到完整的人体表面信息,所以研究者使用了不同于其他深度修复方法的inpainting方法。如上图所示,左边的输入图片中的人通过STN对齐到24个人体表面坐标,随后作为inpainting autoencoder的输入。inpainting autoencoder需要根据输入来预测出同一个人在不同视角下的外观。然后收集同一个人的多个角度下的图片作为修复模块的目标输出来做监督信号去训练模型。这种多视角监督的方法可以近似得到人体的所有外观信息。
  inpainting模块包括 N 个autoencoder,N取决于DensePose中将人体的表面模型分为多少部分,这里N取24 。每个autoencoder单独处理一部分。下图是使用inpaintting autoencoder的效果:

  上图中,对于每一个人的生成结果,顶行是直接使用两个STN对齐的结果,底行是加上了inpainting autoencoder的结果,可以看到加上修复模块后,可以生成更多的衣服纹理特征。

Blending module
  Blending 模块主要是将predictive 模块和warping模块的预测结果混合起来生成更为精细的目标图片。此模块不包含encoder或者decoder,只有2个卷积块和3个残差块。论文的框架中,预测模块和变形模块都先单独预训练之后,再结合混合模块一起训练。

Loss Functions

Reconstruction loss :


Perceptual loss :


这里使用一个预训练好的VGG19网络来对真实图片和生成图片提取中间层特征,这里
\Phi(y) / \Phi(\hat y)
表示中间层特征,v 表示第几层。

Style loss :
Style loss先对VGG19的中间层feature map计算Gram 矩阵,然后计算真实图片与生成图片的Gram 矩阵的Frobenius norm(Frobenius 范数)

针对VGG中间层特征计算Gram Matrix

对真实图片和生成图片的Gram Matrix计算F-范数

Adversarial loss


其中
l(x) = x^{2}

实验结果:
与Deformable GAN做定性比较:


  从效果上来看,与论文的方法相比,感觉DSC生成的细节更多一点,在人脸上
的对比尤其明显。

接着论文与当前的比较新的方法做定量对比:

Quantitative Comparison

best structure model : 在最后训练整个模型的时候只使用
L_{l1}
,
the highest realism model : 在最后训练整个模型的时候使用
L_{l1}
L_{style}

balanced model : 在最后训练整个模型的时候使用完整的Loss :
L_{l1},L_{style},L_{p},L_{GAN}

然后对每个模块和每个loss的作用做了实验,结果如下:


不同模块生成的图片质量对比结果

使用不同Loss生成的图片质量对比结果

另外,论文还与基于人体关键节点的姿态迁移方法生成的图片质量做了对比。效果如下图所示,第一行是基于关键节点的效果图,第二行是基于DensePose的效果图。可以看到,基于DensePose做姿态迁移生成的图片可以更好的生成四肢。


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,607评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,239评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,960评论 0 355
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,750评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,764评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,604评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,347评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,253评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,702评论 1 315
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,893评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,015评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,734评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,352评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,934评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,052评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,216评论 3 371
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,969评论 2 355

推荐阅读更多精彩内容