推荐系统遇上深度学习(一三七)-[阿里]广告精排和创意优选联合优化

今天分享的是阿里在SIGIR2022中稿的一篇短文,主要关注点在于对广告推荐链路中精排阶段和创意优选阶段的优化,一起来看一下。

1、背景

广告系统中,创意(如标题和图片)包含了丰富的产品信息,能够帮助用户快速了解产品。相同的广告通常情况下有不同的创意,如下图所示,但不同创意的CTR可能有较大的差别,有的用户可能偏好于带促销信息的图片,而有的用户偏好于简明的图片风格。因此基于用户的不同偏好,选择合适的广告创意展现给用户,对于广告系统来说是十分重要的一环。

现有的广告推荐系统,为了平衡效果和性能,大都数采用串行多阶段的架构,包括广告召回、广告精排阶段。精排阶段是重点优化的部分,往往通过复杂的模型结构对效果进行优化。出于计算复杂度的考虑,精排阶段往往无法将所有的候选创意都考虑在内,假设每个广告有3个候选创意,计算所有创意对应的CTR会使QPS增长为3倍,因此大多选择随机的创意或者统计CTR最高的创意作为精排阶段的输入。在精排阶段之后,再对每个广告选择合适的创意进行展示。这种架构下,精排阶段输入的并非最终展示的创意,因此创意对于排序的影响是比较小的,对于效果会有一定的影响。

打开收益空间上限的一种理想的优化方式是将创意前置,如放在召回和精排中间,在精排前首先为每个广告选择合适的创意,再进行精排CTR的预估。但这种方式仍然存在以下两方面的挑战:
1)从效率上:多个广告创意的预估计算量级会显著的提升,如何解决创意优选前置带来的耗时问题?
2)从效果上:大部分的广告创意没有得到足够的曝光,在数据稀疏的情况下,如何提升创意选择的准确性?

为了解决效率和效果两方面的问题,论文提出了Cascade Architecture of Creative Selection (CACS)的框架,将创意优选和精排预估做了良好的联动,一起来看一下。

2、CACS架构介绍

2.1 整体架构

CACS架构如下图所示:

相较于现有的大多数框架,CACS将创意选择前置到精排之前,首先进行广告内部的创意选择,再进行广告间的CTR排序。在创意选择过程中,首先,引入双塔结构,有效控制创意阶段的耗时,其次,引入蒸馏学习,来重点学习创意的优先顺序而非准确的CTR预估值,同时也可以在一定程度上减小模型的大小,减少耗时,最后,通过自适应的dropout网络,来学习创意的多模态信息表示,通过多模态的side-information来减少创意没有足够曝光所带来的影响。接下来,对这两部分的具体结构进行介绍。

2.2 List-wise Ranking Distillation

在创意优选阶段,重点是预估准确的创意之间的序关系,而非准确的CTR预估值, 因此论文提出了List-wise Ranking Distillation方法,引入精排阶段的模型进行蒸馏学习。

在loss设计上,并非直接学习精排模型给出的CTR值,而是通过交叉熵损失,使得创意选择模型给出的top1的创意和精排模型给出的top1的创意尽可能接近。具体来说,假设创意优选模型计算的score为{s1,s2,...,sm},精排模型给出的score为{y1,y2,...,ym}。假设第i个创意为精排给出的top1的创意,那么loss计算如下:

2.3 Adaptive Dropout Network

由于大多数创意没有足够的展示,因此仅仅使用ID特征会面临数据稀疏的问题,很多ID对应的Embedding无法进行充分的学习,因此在输入特征上,引入了标题、图片等多模态的side-information。并通过CNN和Bert等对图像和文本信息进行处理。不同用户对于不同模态的信息关注程度不同,进一步引入Attention机制来对用户的模态信息偏好进行建模。

另一方面,为了减少ID特征对于最终结果的影响,论文提出了自适应的Dropout网络,基于ID对应的曝光量自适应计算Dropout的比例,如果曝光次数越多,ID学习越充分,此时可以更多依赖ID信息来进行预测,dropout的比例可以适当减少,反之增加,过滤比例计算如下:

基于每个创意的dropout比例,通过伯努利分布计算得到对应的mask,再乘上相应的系数保证训练和预测阶段的分布一致:

论文的基本思路就介绍到这里,接下来看一下实验结果。

3、实验结果

论文的实验结果分离线和在线两部分。首先来看下离线部分,离线实验主要关注创意选择方法的准确性,结果如下:

线上部分主要关注CACS架构和无创意优选模块以及传统创意选择架构的对比,关注效果和耗时两方面,结果如下:

好了,论文就介绍到这里,感兴趣的同学可以阅读原文~

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,941评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,397评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,345评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,851评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,868评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,688评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,414评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,319评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,775评论 1 315
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,945评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,096评论 1 350
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,789评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,437评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,993评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,107评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,308评论 3 372
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,037评论 2 355

推荐阅读更多精彩内容