因果推断推荐系统工具箱 - CFF（一）

文章名称

【CIKM-2021】【Beijing Key Laboratory of Big Data Management and Analysis Methods-AntGroup】Counterfactual Review-based Recommendation

核心要点

文章旨在解决现有基于评论的推荐系统中存在的评论稀疏和不平衡的问题，提出在feature-aware的推荐场景下，利用反事实样本提升模型性能。作者通过修改（Intervention）用户的偏好（体现在用户的一些评论信息里）来生成反事实样本，并使用观测样本和反事实样本共同训练推荐模型，提升模型性能。在生成反事实样本时，利用learning-based方法代替随机生成的方式，生成最能够提升模型性能的反事实样本。此外，作者进行了理论分析，讨论生成样本数量和模型受到的噪声干扰的关系。

研究背景

现有基于评论的方法可以分为两大类，具体案例如下图a。

Document Level。该类方法[4]将（该用户或该物品）的所有的评论看作一个文档学习用户或向量的embedding。这不可避免引入噪声，影响模型性能。
Aspect Level。该类方法提取用户对物品的不同方面的情感倾向，得到（用户、项目、特征、情绪）元组[7]。例如，用户评论“我喜欢这件衬衫的领子，但是袖子不满意，因为对我来说太紧了”，最终提取的元组为“（user id, item id, 领子, 正反馈）”和“（user id, item id, 袖子, 负反馈）”。

review case and statistics

然而，上述方法都没有触及评论推荐的本质问题，即数据稀疏和不平衡。评论信息能极大地提升推荐系统的性能，但评论信息也是稀疏的、不平衡的，给准确、高效的推荐带来了极大挑战，需要付诸极大地努力使得模型取得令人满意的性能。在亚马逊数据集上的统计结果显示，只有极少数用户经常评论，以及极少数的物品和方面被提及。

因此，作者借鉴反事实的思想，通过最小程度的调整用户偏好，来改变用户物品偏好的排序结果（pairwise loss），以此生成反事实样本。

方法细节

基础模型

作者采用BPR loss[19]进行pairwise的学习，具体的损失函数如下图所示。其中， $\boldsymbol{O}^{}_{}$ 表示训练样本， ${\sigma}^{}_{}$ 是sigmoid函数， ${g}^{}_{}$ 表示推荐模型（这里应该是排序模型），第二项整体表示正则项。 ${r}^{}_{u\cdot}$ 表示用户对物品的偏好分数。

BPR loss

生成反事实样本

如前所述，用户评论是稀疏的。同时，用户在对商品不同特性（方面）的关注度影响了用户的偏好，例如，下图中，用户关注品牌则会选择”IPhone“，如果更关注价格，则选择”小米“。因此，通过改变（Intervene on）用户的特性关注度，可以得到反事实，并利用（已有的，可能是预训练得到的）推荐模型 $g$ 对样本进行预测，可以得到反事实样本的标签。

sample generation

比较Naive的方法是随机样本和用户的关注特征进行替换，但是由于样本和特性的重要程度不同[12]，这种方法显然是次优的。作者采用learning-based方法学习反事实样本生成（这个现在应该是反事实样本生成的基操了）。作者借鉴[1, 12]的做法，通过学习如何最小限度的改变用户对特性的关注度（特征表示用户偏好），从而改变模型 $g$ 的决策结果，来生成反事实样本，这其实是利用了模型的决策边界反映数据潜在结构或模式的特性。其示意如上图中子图b所示。

具体的，作者引入扰动 ${\tau}^{}_{} \in {\R}^{|\mathcal{F}^{}_{}|}_{}$ ，该扰动向量的每一个元素作用于物品的每一个特性（也可以是特性的隐向量表示）。其中， $\mathcal{F}$ 表示所有特性的集合。随后利用如下图所示的公式寻找最优的扰动。

perturbation generation loss

其中， ${r}^{*}_{}$ 的计算公式如下图所示， $\boldsymbol{A}^{}_{u} \in {\R}^{|\mathcal{U}| \times |\mathcal{F}|}_{}, \boldsymbol{B}^{} _{i} \in {\R}^{\mathcal{I}| \times |\mathcal{F}|}_{}$ 分别表示用户和物品的特征矩阵，也就是每个用户对特性的关注程度，以及每个物品在该特性上的质量。

r start

值得注意的是，在学习 ${\tau}^{}_{}$ 优化过程中， $g$ 的参数是被固定的。损失函数中的第一项的目标是寻找最小化扰动，第二项的目标是改变模型对两个物品的偏好排名。

本节讲解了作者的研究背景，基础模型和生成反事实样本的思路，下一节继续介绍反事实生成的控制细节和理论分析。

心得体会

反事实样本生成

这篇文章的作者也有来自Rutgers University的大佬，所以套路和因果推断推荐系统工具箱 - CCF（一）以及因果推断推荐系统工具箱 - DCCF（一）非常类似，都是先利用反事实样本来增强模型，生成方法主要是learning-based方法，目标是生成所谓的“hard sample”来最大限度的提升模型的性能。最终，分析了模型的错误率与样本数量以及噪声的关系。

同时，生成反事实的过程是利用一个预训练的弱推荐模型 $g$ ，判断反事实样本的标签，进而在训练模型得到更高性能的 $g$ （或者说 $g\prime$ ）感觉有点像bootstrap。

文章引用

[1] Ehsan Abbasnejad, Damien Teney, Amin Parvaneh, Javen Shi, and Anton van den
Hengel. 2020. Counterfactual vision and language learning. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 10044–10054.

[4] Rose Catherine and William Cohen. 2017. TransNets: Learning to Transform for Recommendation. arXiv preprint arXiv:1704.02298 (2017).

[7] Tong Chen, Hongzhi Yin, Guanhua Ye, Zi Huang, Yang Wang, and Meng Wang.2020. Try This Instead: Personalized and Interpretable Substitute Recommendation. (2020).

[12] Yash Goyal, Ziyan Wu, Jan Ernst, Dhruv Batra, Devi Parikh, and Stefan Lee. 2019. Counterfactual visual explanations. arXiv preprint arXiv:1904.07451 (2019).

[19] Steffen Rendle, Christoph Freudenthaler, Zeno Gantner, and Lars Schmidt-Thieme. 2009. BPR: Bayesian personalized ranking from implicit feedback. In Proceedings of the twenty-fifth conference on uncertainty in artificial intelligence. AUAI Press, 452–461.

禁止转载，如需转载请通过简信或评论联系作者。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,427评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,551评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 165,747评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,939评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,955评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,737评论 1赞 305
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,448评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,352评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,834评论 1赞 317
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,992评论 3赞 338
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,133评论 1赞 351
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,815评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,477评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,022评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,147评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,398评论 3赞 373
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,077评论 2赞 355