推荐系统遇上深度学习(六十六)-[阿里]基于多任务学习的CVR预估模型ESM2

今天介绍的文章名称是《Conversion Rate Prediction via Post-Click Behaviour Modeling》
论文下载地址为:https://arxiv.org/abs/1910.07099

在本系列的第十九篇文章中,我们已经介绍过一种基于多任务学习的CVR预估模型ESMM,同样是阿里发表的论文。本文可以看作是ESMM的升级版,一起来学习一下吧。

1、背景

一个包含推荐系统、用户行为的完整电商推荐流程如下图所示:

主要分为两个部分,一是推荐阶段,二是用户行为阶段。推荐阶段大都分为召回和精排两部分,精排之后有时候会通过一些规则进行打散,然后展示给用户。用户看到推荐的物品,称作Impression(可翻译为曝光),用户看到自己感兴趣的物品,会Click(点击),如果觉得还不错,会Buy(购买)。因此用户行为阶段的一般过程是Impression - Click - Buy。

此时我们就会有两个主要的概念:CTRCVR,同时这两个指标也是电商推荐系统所要预估的重点部分。CTR是曝光到点击的概率,而CVR是点击到购买的概率。

传统的CVR预估问题存在两个主要的问题,一是样本选择偏差(sample selection bias,SSB),二是数据稀疏(data sparsity,DS),如下图所示:

样本选择偏差(sample selection bias,SSB):假设把给用户曝光过的产品看作是整个样本空间X,用户点击过的产品仅是中间的部分,定义为Xc。传统的推荐系统仅用Xc中的样本来训练CVR预估模型,但训练好的模型是在整个样本空间X去做推断的。由于点击事件相对于曝光事件来说要少很多,因此只是样本空间X的一个很小的子集,从Xc上提取的特征相对于从X中提取的特征而言是有偏的,甚至是很不相同。从而,按这种方法构建的训练样本集相当于是从一个与真实分布不一致的分布中采样得到的,这一定程度上违背了机器学习中独立同分布的假设。这种训练样本从整体样本空间的一个较小子集中提取,而训练得到的模型却需要对整个样本空间中的样本做推断预测的现象称之为样本选择偏差。样本选择偏差会伤害学到的模型的泛化性能。

数据稀疏(data sparsity,DS):推荐系统展现给用户的商品数量要远远大于被用户点击的商品数量,同时有点击行为的用户也仅仅只占所有用户的一小部分,因此有点击行为的样本空间Xc相对于整个样本空间X来说是很小的,通常来讲,量级要少1~3个数量级。这就是所谓的训练数据稀疏的问题,高度稀疏的训练数据使得模型的学习变得相当困难。

为解决上述两个问题,阿里曾经发表过多任务学习模型ESMM,简单回顾一下:

ESMM中有两个子网络,二者共享Embedding部分,分别输出CTR预估值pCTR和CVR预估值pCVR。Loss分为两部分,一是CTR预估带来的loss,二是pCTCVR(pCTR * pCVR)带来的loss。这样就可以在整个样本空间上训练CVR预估模型。

但是对于CVR预估来说,ESMM模型仍然面临一定的样本稀疏问题,毕竟从点击到购买的样本非常少。但挖掘用户行为,发现用户在购买前往往会有其他的行为,比如把想要购买的物品加入购物车或者心愿单。如下图所示:

加入心愿单/购物车的数据相较购买数据还是比较多的,因此可以基于这部分数据,通过多任务学习模型来求解CVR模型。如图所示,文中把加入购物车或者心愿单此类行为称作Deterministic Action (DAction) ,而其他对购买相关性不是很大的行为称作Other Action(OAction) 。此时原来的 Impression→Click→Buy过程变成了更加丰富的Impression→Click→DAction/OAction→Buy过程。

本文提出的模型基于Impression→Click→DAction/OAction→Buy过程来建模CVR预估问题,称作Elaborated Entire Space Supervised Multi-task Model(ESM2),一起来看下吧。

2、ESM2模型介绍

2.1 模型整体架构

模型整体架构如下:

可以看到,一共有四个任务,分别是:

Y1:点击率
Y2:点击到发生DAction的概率
Y3:发生DAction到购买的概率
Y4:发生OAction到购买的概率

这里好像少了一个从点击到OAction的概率,这是因为DAction和OAction是对立事件。

因此,此时CVR = (1 - Y2) * Y4 + Y2 * Y3

2.2 模型细节

上述的四个子任务,其用的样本相同的,在整个样本空间中进行训练。其输入首先经过共享嵌入模块(Shared Embedding Module (SEM))转换为对应的嵌入向量,随后通过四个独立的神经网络分别预估Y1、Y2、Y3和Y4。

2.3 损失函数

既然是在整个样本空间上的学习,那么计算的损失必须是从Impression开始的,那么计算损失首先需要计算下面三个部分:

pCTR:Impression→Click的概率直接由第一个网络的结果得出
pCTAVR:Impression→Click→DAction的概率,pCTAVR = Y1 * Y2,由前两个网络的输出结果相乘得到
pCTCVR:Impression→Click→DAction/OAction→Buy的概率,pCTCVR = CTR * CVR = Y1 * [(1 - Y2) * Y4 + Y2 * Y3],由四个网络的输出共同得到。

随后通过三个logloss分别计算三个部分的损失:

而完整的损失函数由三部分加权得到:

而在预测时,只需要经过后三个网络,便可以计算对应的CVR。

3、实验结果

本文对比了几个模型在CVR预估上的效果:

GBDT
DNN使用Click→Buy的样本来训练CVR模型,使用Impression→Click的样本来训练CTR模型
DNN-OS,对Click→Buy的样本进行过采样,其他同DNN
ESMM
ESM2

评价指标包括AUC和GAUC,GAUC是对每个用户的AUC进行加权的结果:

实验结果表明本文提出的ESM2模型在CVR预估上表现较为突出:

好了,本文介绍就到这里,其他的实验结果以及模型的一些细节,大伙可以阅读原论文。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,743评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,296评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,285评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,485评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,581评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,821评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,960评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,719评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,186评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,516评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,650评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,329评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,936评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,757评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,991评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,370评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,527评论 2 349

推荐阅读更多精彩内容

  • 一、LR (一)简单总结 是广义线性模型,每个特征都是独立的,如果需要考虑特征与特征之间的相互作用,需要人工对特征...
    一个想当大佬的菜鸡阅读 4,006评论 0 1
  • 声明:此故事纯属虚构,如有雷同,纯属巧合。 小颖长的小巧可爱,一笑起来弯弯的眼睛就如同两弯小月牙,不笑的时候,眼睛...
    曲中人2019阅读 300评论 0 0
  • 更可悲的是,这些话不能跟他说,他会想知道吗?知道以后什么反应? 说别让我想这么多?我真的害怕,他昨天晚上还说,要是...
    诉颜阅读 108评论 0 0
  • 钗头凤•处暑秋 林忠顺 热将处。身需补。雨打芭蕉留不住。 汗淅淅。泪凄凄。两厢滋味,问水之伊。 愚。愚。愚。 寒结...
    林忠顺阅读 827评论 10 17