[论文]Learning to Summarize Web Image and Text Mutually

论文地址

一、任务

1、图像文字摘要:图像->sentence描述,image classification model,PIS->ITJS

2、文字可视化:文字->图像,text categorization model?选择文本语义相近的image作为视觉表达,PTS->ITJS

二、相关研究

1、Events in still image

1)event classification:研究较少,主要集中在特定的领域,例如human activity/action分类

2)可视图像的sentence & summarization 生产:AND-OR graph等。These methods generate a direct representation of what objects exist and what is happening in a scene, and then decode it into a sentence. 文本生成依赖object recognization,但后者依然很难。

这篇paper的区别:We focus on the problem of summarizing images using high-level semantic sentences or short articles collected from the Internet, not just describing “what are there” or “what

is happening” in images.

2、Cross-Media Retrieval

1)[2,5,12,15]代表的第一代的多模检索引擎支持文本形式的query来查询不包含text metadata的image,但是这些image往往具有keyword、class labels

2)[3]是一个列外,它从image和text上学习了“latent-space”

3)更高级的系统[22,28]通过fusing features from different models into a single vector,或者先为不同的模式学习不同的模型之后再fusing outputs[16,27]

4)上述方法的输入基本都要求both image and text features

5)当前已经有方法通过将image和text映射到同一空间进而支持相关性计算[25]

三、Mutual-Summarization

1、Image Summarization

简化为检索问题Image->Sentence

进一步引入ITJS数据,I->S ≈ I->D + D->S≈I->ID + ID->TD + TD->S ,其中D=

重要假设:在ITJS空间里,属于同D的I和T是语义相关的。因此,简化为两个问题:image classification 和自动文本summarization

1)自动文本Summarization

采用MEAD[24]系统生成文本的summarization,MEAD实现了多种摘要的算法,例如position-based的,Centroid,TF*IDF,和Query-based。两个baseline的摘要方法:lead-based 和random-based,前者按顺序取cluster中所有doc的首句and依次往后的句子;对应的random方法从cluster中随机选择句子。本文采用lead-based的单个文档的摘要生成。采用的压缩比是25%。

2)Image Classification

简化为6-class的图像分类任务。分类采用的多核SVM(Multiple Kernel SVM,MK-SVM)[8,26],并和MK-KNN和SCA[25]做了比较

a)MK-SVM

特征:optimal combination of state-of-art features and spatial pyramid levels,by using the MKL technique

模型:H(I,Y,Θ)=Sum Θi * [K(α(I),α(Ii)),Yi]

α表示图片的特征描述,Yi是类标,K是a positive definite kernel, obtained as a liner combination of histogram kernels。

核:K(α(I),α(Ii))= sum 1to#α  βk*k(αk(I),αk(Ii))

sum 1to#α βk = 1

其中,#α是描述图片的特征数,例如当有两类特征Color Histogram 和 Pyramid SIFT时,#α=2。

MKL 负责学习系数Θi 和 histogram combination weights βk ∈[0,1]

k作为核函数,考虑了3种类型(不同的判别能力和计算代价),该文的首选是histogram intersection kernel(The Histogram Intersection Kernel is also known as the Min Kernel and has been proven useful in image classification)

k(x,y) = sum{min(xi,yi)}

同时,该文也对比了RBF核和线性核来对比分类效果。

b)Multiple Kernel KNN(MK-KNN)

在KNN的基础上,对Similarity metric进行改动:s(x,y) = K(x,y)

c)Semantic Correlation Matching(SCM)

[25]使用Canonical correlation analysis(CCA,典型关联分析)来分别为图片和文本学习canonical components,wi 和wt。

3)Sentence Selection

在图片分类过程后,一个新的图片I可以被映射到ID。根据M(ID-TD)和M(TD-S),可以死得到一系列sentence S ,ranked by 与I的置信度Confidence。

Con f(x,y) = K (x,y), Conf(I,S) ≈ Conf(I,ID)

2、Text Visualization

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 210,914评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 89,935评论 2 383
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,531评论 0 345
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,309评论 1 282
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,381评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,730评论 1 289
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,882评论 3 404
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,643评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,095评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,448评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,566评论 1 339
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,253评论 4 328
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,829评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,715评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,945评论 1 264
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,248评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,440评论 2 348

推荐阅读更多精彩内容