EMD距离(Earth Mover's Distance)

EMD(搬土距离)(Earth Mover's Distance)

参考:

http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/RUBNER/emd.htm
https://www.cnblogs.com/jackyzzy/p/3314667.html
http://blog.csdn.net/wangdonggg/article/details/35280735

详细的数据推导: http://blog.csdn.net/zhangping1987/article/details/25368183

Earth Mover's Distance,是2000年IJCV期刊文章《The Earth Mover's Distance as a Metric for Image Retrieval》基于运输问题的效率 提出的一种直方图相似度量。 它是归一化的从一个分布变为另一个分布的最小代价, 可以用来测量两个分布(multi-dimensional distributions)之间的距离。

EMD需要求解运输问题,其运算复杂度较高,平均而言至少是二次方级别。但是它作为距离函数,有一个非常好的特点是存在下界——两个分布的质心之间的距离,因此在粗略计算时,可以考虑用分布质心之间的距离代替EMD。

两个分布:

    (位置, 权重)

    P = {(p1, wp1), (p2, wp2), ..., (pm, wpm)}

    Q = {(q1, wq1), (q2, wq2), ..., (qn, wqn))}

    D = [dij]  表示位置 pi 到 位置 qj的距离

    F = [fij]  表示权重 wpi 到 wqj 的权重

代价函数:

    WORK(P, Q, F) =  sum(dij * fij for i in range(1:m) for j in range(1:n))

限制条件:

    fij > 0

    sum(fij for j in range(1:n)) <= wpi    从i处搬出来的重量不能超过wpi所有的总和
    
    sum(fij for i in range(1:m)) <= wqj    搬到j处的重量不能超过wqj能存放的总重量
    
    WORK = min(sum(wpi for i in range(1:m)), sum(wqj for j in range(1:n)))
    当仓库总重量和工厂货物总重量不一致时, 才需要限制第四个条件

动态规划的问题:

    F是线性优化问题的最优解,earth mover's distance 定义为归一化后的WORK:
    EMD(P, Q) = WORK(P, Q, F)
                    Divide
                sum(fij for i in range(1:m) for j in range(1:n))
    为了使EMD的值不随着运输总量的大小变化而变化, 引入归一化因子-总的运输量,  (The normalization factor is introduced in order to avoid favoring smaller signatures in the case of partial matching.)

EMD距离ground distance的优势:

  • Naturally extends the notion of a distance between single elements to that of a distance between sets, or distributions, of elements.
    将距离的概念扩展到集合/概率分布

  • Can be applied to the more general variable-size signatures, which subsume histograms. Signatures are more compact, and the cost of moving ``earth'' reflects the notion of nearness properly, without the quantization problems of most other measures.

  • Allows for partial matches in a very natural way. This is important, for instance, for image retrieval and in order to deal with occlusions and clutter.
    允许计算部分的相似度, 对于图像检索这很重要

  • Is a true metric if the ground distance is metric and if the total weights of two signatures are equal. This allows endowing image spaces with a metric structure.

  • Is bounded from below by the distance between the centers of mass of the two signatures when the ground distance is induced by a norm. Using this lower bound in retrieval systems significantly reduced the number of EMD computations.
    有下界-两个分布的质心之间的距离, 粗略估计可以减少大量计算

  • Matches perceptual similarity better than other measures, when the ground distance is perceptually meaningful. This was shown by [2] for color- and texture-based image retrieval.
    分布在视觉上有意义时, EMD距离比其它距离估计更有好, 可以参照基于色彩以及纹理的图像检索

使用:

C代码包: emd.h, emd.c, emd.i

OpenCV:实现了EMD api, 
    pip install --upgrade setuptools
    pip install numpy Matplotlib
    pip install opencv-python

import numpy as np
import cv

#p、q是两个矩阵,第一列表示权值,后面三列表示直方图或数量
p=np.asarray([[0.4,100,40,22],
        [0.3,211,20,2],
        [0.2,32,190,150],
        [0.1,2,100,100]],np.float32)
q=np.array([[0.5,0,0,0],
        [0.3,50,100,80],
        [0.2,255,255,255]],np.float32)
pp=cv.fromarray(p)
qq=cv.fromarray(q)
emd=cv.CalcEMD2(pp,qq,cv.CV_DIST_L2)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,525评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,203评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,862评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,728评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,743评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,590评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,330评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,244评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,693评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,885评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,001评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,723评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,343评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,919评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,042评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,191评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,955评论 2 355

推荐阅读更多精彩内容

  • 这次给大家介绍一下GAN的generalized framework。其实很多研究都是这样,先找到一个比较直观好理...
    fada_away阅读 2,221评论 0 3
  • 信用评分卡主要有三种(A卡、B卡、C卡): A卡:申请评分卡,侧重贷前,在客户获取期,建立信用风险评分,预测客户带...
    JSong1122阅读 6,005评论 0 9
  • 一天很长,一年很短,相遇就在一刻,分离却在不知不觉中进行。 曾经我们怀抱着刺一点点试着靠近,如今却背靠背在默默地远...
    九界jiujie阅读 652评论 0 1
  • “你,还好吗”,五大三粗的大胡子遇见多年不见的柳柳,终于憋出了一句话。 “还ok啊,你呢”,柳柳故作镇定地回道,她...
    芬兰子阅读 206评论 0 0
  • 梦是无意识层面里对欲望的一种达成。 1900年《梦的解析》的出版,这个标识了弗洛伊德向外展示了精神分析的雏形。 梦...
    郑小p阅读 99评论 0 0