因果推断推荐系统工具箱 - Dual Unbiased Recommender Learning for Implicit Feedback

文章名称

Dual Unbiased Recommender Learning for Implicit Feedback

核心要点

文章在原有解决推荐系统数据偏差的方法的基础上，提出显示纠正负反馈偏差。作者利用观测到正反馈的概率作为桥梁，链接用户对某个物品的点击概率和偏好概率。通过概率推导，提出对偶学习模型，同时消除正、负反馈（点击、非点击）数据的偏差。方法在正反馈数据上，估计用户的正向偏好，在负反馈数据上估计负向偏好两种propensity score，并在loss函数里把两者结合在一起，并证明这种方法学习到的模型在正、负反馈每一个子集上都是无偏的。

方法细节

问题引入

文章旨在解决推荐系统中MNAR问题造成的模型偏差。现有方法只重点解决了点击（正反馈）数据的偏差，而没有考虑负反馈的偏差（没有显示纠正），会造成模型得到次优解。
假设用户的反馈矩阵为 $Y \in \{ 1, 0 \}^{m \times n}$ ， $y_{u, i}$ 表示用户是否点击了某个物品的曝光。矩阵 $R \in \{1, 0 \} ^{ m \times n}$ 表示用户的实际偏好矩阵， $r_{u, i}$ 表示用户是否喜欢某个物品。矩阵 $O \in \{1, 0\}^{m \times n}$ 表示用户的实际偏好矩阵， $o_{u, i}$ 表示用户是否被曝光了某个物品。并且，我们假设用户点击了某个物品，意味着用户被曝光了该物品，且用户对该物品是有正向偏好的（虽然喜欢的程度可能不同，但是是喜欢的）。那么，我们可以得到如下公式。也就是说，观测到用户点击了某个物品的曝光的概率，是由物品是否被曝光和物品是否被用户喜欢的概率的乘积决定。

probability

在完整的数据集上，我们可以得到理想情况下的损失函数，如下图所示（在之前的很多文章中都见到了，是类似EIB的损失函数，可以参见因果推断推荐系统工具箱 - Doubly robust joint learning for recommendation on data missing not at random（一））。其中， $\delta_{u,i}^{+}$ 和 $\delta_{u,i}^{-}$ 分别表示，相关的和不相关的用户-物品元组的估计损失（注意，这个相关和不想关，我们是不知道的，是隐变量）。

ideal loss

带入公式（1）所示，类似IPS，我们可以得到无偏的损失函数，如下图所示。也就是把 $\gamma_{u,i} = \frac{y_{u, i}}{\theta_{u,i}}$ （注意，这里 $y_{u,i}$ 其实代表了点击的概率，感觉有点滥用符号的意思，但是考虑到作者是在数据集上用 $y_{u,i}$ 这个值，所以也可以理解。）

unbiased loss

作者认为只在观测到点击的数据集上是无偏的，因为当 $y_{u, i} = 1$ 的时候， $\gamma_{u, i} = \frac{1}{\theta_{u,i}}$ 。

unbiased positive

然而，在未观测到点击的用户-物品元组上， $y_{u, i}=0$ 时，损失函数只包含对未观测数据的估计，没有其真实值，换句话说，不是两种情况下数据结果的概率加权和。

biased negative

具体做法

Dual Propensity Score

因此，作者采用两个propensity score分别表示在观测数元组上和未观测元组上，用户的偏好和点击的关系。具体的，由于 $c^{+}_{u, i} = \theta_{u, i}^{+} \gamma_{u, i}^{+} 且 c^{+}_{u, i} =p(y_{u, i}=1)，\theta^{+}_{u, i} =p(o_{u, i}=1)，\gamma^{+}_{u, i} =p(r_{u, i}=1)$ ，表示用户-物品元组，在观测到点击的数据上，满足点击概率由用户对物品的偏好，和物品是否被曝光给用户共同决定，且两者是乘积关系。由此，可以推导出，曝光概率可以用给定用户特征和偏好的情况下，其点击该物品的条件概率表示。

positive propensity score

同理，也可以推导出没有被观测到点击的数据上的propensity score。
表示某个物品没有被曝光的概率可以用给定用户特征和不喜欢该物品的概率的情况下，其不点击该物品的条件概率表示（有点拗口，其实都是反正）。

negative propensity score

最后，作者把这两个propensity score带入到ideal loss的公式中，得到如下图所示的dual loss。

dual loss

并且，经过如下两个推导过程，可以证明dual loss在观测到点击正反馈的数据集上，以及未观测到反馈的（负反馈）数据集上，都是无偏的。推导过程很简单，主要是把对 $y_{u,i}$ 相关的期望值，换成了对应的概率（由于是伯努利分布）。

proof of positive case

proof of negative case

此外，为了缓解propensity score方差较大的问题，作者也提出了可以利用SNIPS的方法或者是截断propensity score的方法，这类操作都比较常规，这里不再赘述，感兴趣的可以参考原文。

最后，其实也是最关键的，作者提出的propensity score并不是通过模型估计出来的，而是统计出来的， $n_i$ 表示物品的所有点击的数量（作者提到这是由于解决的是popularity bias，点击次数就反映了流行度，其实也可以用模型估计）。此外， $\alpha = \beta = 0.5$ 是作者根据经验设定的超参数取值，具体问题具体炼丹...

calculate propensity score

总的感觉，这篇文章主要是由于ideal loss不同于其他文章，导致存在作者说的问题。是否是这个逻辑，应该需要视场景而定。

心得体会

为什么和之前说的IPS是无偏的不一样？

个人理解，这里说IPS的方法只在观测到的点击数据上是无偏的，和之前的文章是不冲突的。之前的方法的ideal损失函数，本身就没有考虑存在未观察误差的问题，而这里的ideal loss本身，就引入了未被观测到的用户-物品元组的误差。所以，到底ideal的情况下，是否存在未观测到的点击误差的这一项是值得讨论的，或许这一项并不是必要的（因为已经假设ideal是全都可以观察到的）。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,372评论 6赞 498
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,368评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,415评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,157评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,171评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,125评论 1赞 297
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,028评论 3赞 417
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,887评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,310评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,533评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,690评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,411评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,004评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,659评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,812评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,693评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,577评论 2赞 353