推荐系统遇上深度学习(七十三)-[微软]通过对抗训练消除位置偏置信息

本文介绍的论文是:《Modeling and Simultaneously Removing Bias via Adversarial Neural Networks》

前面已经有几篇关于消除CTR预估中位置偏置信息的介绍,如华为的PAL、youtube的shallow tower、以及将位置信息作为输入特征的方法。但对于样本中可能存在的偏置信息,上述的方法都没有解决,而本文提出的对抗学习框架,不仅解决了一般的位置偏置,还能够消除样本特征中的偏置信息,一起来学习一下吧。

1、背景

对于搜索广告的排序,往往是基于对于广告点击率的预估以及广告主的出价(bid)来决定的。但是用于训练点击率预估模型的样本中,往往存在一定的偏置信息。

在训练点击率预估模型时,许多特征属于统计特征,比如搜索关键词和广告的交叉点击率。对于经常展示的关键词/广告对来说,这类特征比较丰富且置信,但是对于不经常展示或者从未展示过的关键词/广告对来说,这类信息非常稀疏且不置信,模型对这些关键词/广告的信息不能充分学习,很难将这些关键词/广告对的展示位置进行提前。

同时,当CTR模型进行更新时,所使用的数据往往是在线上应用前一版模型而收集到的。新的数据和模型更容易学到这些展示位置靠前的关键词/广告对的信息,这种情形文中称为“Feedback Loop”,此时我们的训练所使用的数据,是存在一定偏置信息的。

这种偏置信息的存在,大都集中于位置偏置,即不同的展示位置对于CTR的影响不同,越靠前位置展示的广告,点击率会偏高。因此有必要在模型训练的过程中消除这些信息。

关于位置偏置信息的消除,前面几篇论文中已经提到过几种方法了,简单回顾一下:

位置信息作为特征

华为PAL框架

Youtube Shallow-Tower

但上面几种方法虽然在一定程度上解决了位置偏置信息,但是样本中的偏置信息没有解决,举个简单的例子,比如某用户和某个品类的点击率交叉特征,这个特征本身也是存在偏置的,有可能某种品类的展示位置靠前导致了用户对于这种品类的商家点击率特别高。

本文提出的对抗学习框架,不仅解决了一般的位置偏置信息,还能够消除样本特征中的偏置信息,一起来学习一下吧。

2、对抗学习框架

2.1 框架介绍

对抗学习(Adversarial Neural Network)的框架如下图所示:

模型一共包含四个部分,BaseNet、Bypass Net、Prediction Net和Bias Net。

对于ByPass Net,输入是该样本对应位置的点击率b,定义为P(y|Position = p) 。通过参数ΘBY得到输出ZBY,这里类似于youtube的shallow tower,但输入特征只有一个该位置的点击率。

再看看另一侧,输入是特征X,输入特征首先经过Base Net,对应参数为ΘA,得到输出ZA

得到ZA之后,会经过两个Net,第一个是Bias Net,对应的参数为ΘB,该网络的输出为该样本对应的位置预测点击率,前面说了,由于Feedback Loop的存在,输入特征中是存在一定的偏置信息,那么基于这些特征,是可以学习到一定的偏置信息的。

第二个是Prediction Net,对应的参数为ΘY,得到输出ZY

2.2 对抗训练过程

接下来我们介绍下对抗训练的过程,主要分为两步。

首先看看对于Bias Net的训练。这一步我们固定其他几个网络的参数,只更新Bias Net的参数ΘB,对应的损失函数为:

这里我们期望Bias Net能对Base Net得到的输出,能够准确得到其中包含的偏置信息。

当Bias Net训练一轮之后,保持ΘB不变,再训练剩下的网络参数ΘA、ΘY和ΘBY,此时的损失为:

可以看到,损失的第一部分是logloss:

第二部分是将此时Base Net所得到的输出,输入到参数固定的Bias Net中,所得到的预测值,和实际样本的位置点击率b的协方差的平方:

当二者完全不相关时,第二部分的损失是最小的。

好了,对抗学习的思路是如何体现的呢?这里简单说下我的理解。Bias Net相当于GAN中的D,剩余三部分可以看作是G。我们期望Bias Net能够准确识别输入中的偏置信息,而通过剩余三部分的训练,期望Base Net输出的ZA能够骗过Bias Net,如果无法骗过Bias Net,那么Bias Net得到的输出和实际样本的位置点击率b的协方差的平方会比较大,导致整个G的损失增大。如果能够骗过Bias Net,使Bias Net得到的输出和实际样本的位置点击率b的协方差尽可能接近0,那么此时可以认为Base Net输出的ZA中偏置信息基本被消除了。

基于上述介绍,整个对抗网络的训练过程如下:

2.3 线上应用

那么在线上应用时,只运用Base Net、Prediction Net和Bypass Net。而Bypass Net的输入设置为位置1的位置点击率。

3、实验结果

有关实验结果,论文中使用的是仿真实验的方式,这里就不再细讲,感兴趣的同学可以看下原论文。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,723评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,485评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,998评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,323评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,355评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,079评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,389评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,019评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,519评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,971评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,100评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,738评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,293评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,289评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,517评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,547评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,834评论 2 345

推荐阅读更多精彩内容