CTR预估

一、概要

  1. 目标:将合适的内容,在合适的场景,展示给合适的人
  2. 量化指标:CTR,Click-Through-Rate,点击通过率
  3. 应用场景:广告展示、推荐、搜索结果排序
    广告,考虑ECPM指标(earning cost per mille),每1000次曝光带来收入,ECPM=1000 x CTR x 点击出价。https://36kr.com/p/5150648.html
    商品推荐,需要考虑转化率、商品盈利能力等因素。

二、学习目标
1.分类问题,1-点击,0-没点击
2.回归问题,具体的ctr数值
3.多分类问题,根据ctr数值分桶?
业界使用较多的是?几种方式的优劣?适用场景?

三、特征选取&处理
1.item特征
标题、封面图、品牌、分类、tag等等
2.用户特征
年龄,性别,过往记录
3.上下文(场景)特征?

特征处理?跟模型有关,端到端的就不用处理了?
离散值 vs 连续值?
高维、稀疏、多Field
特征之间的关联关系,独立 vs 交叉?(例:衣服类型与性别?)
1.稀疏->稠密,特征独立->特征与特征之间的关系
one-hot, embedding

  1. 如何实现Embedding
    矩阵分解(MF)、因子分解机(FM)、神经网络

四、预估模型(损失函数,优化算法)

  1. 经典机器学习
    *. LR, 一般作为性能的benchmark? 线性-二阶多项式,LR+正则化+特定优化方法
    缺点:手工设计特征,需对特征离散化,归一化,特征离散过程的边界问题,特征组合。
    *. GBDT + LR
    Gradient Boosting Decision Tree
    能处理连续值特征?具有一定的特征组合能力,可以对特征的重要性排序。
    *. MLR,阿里,聚类+LR
  2. 神经网络
    image

    https://www.jiqizhixin.com/articles/2018-07-22-19
    https://zhuanlan.zhihu.com/p/32689178
    https://zhuanlan.zhihu.com/p/32885978
    https://github.com/nzc/dnn_ctr
简写 日期 全称 中文解释
FM Factorization Machines 因子分解机,二次交叉特征
FFM Field-aware Factorization Machines 基于领域的因子分解机
DCN 2017 Deep & Cross Network 深度与交叉神经网络
FNN 2016 Factorisation Machine supported Neural Network 因子分解机神经网络
DeepFM -
NFM Neural Factorization Machines 神经网络因子分解机
PNN Product-based Neural Networks 基于向量积的神经网络
AFM Attentional Factorization Machine 注意力因子分解模型
MLP 多层感知机
W&D 2016 wide & deep 宽度与深度模型
DIN Deep Interest Network 深度兴趣网络

其他:
https://juejin.im/entry/5ae19299f265da0b796495c6

五、效果评估

参考文档:
https://zhuanlan.zhihu.com/p/32689178
https://zhuanlan.zhihu.com/p/32885978
https://zhuanlan.zhihu.com/p/33045184
https://zhuanlan.zhihu.com/p/33177517
https://zhuanlan.zhihu.com/p/33479030
https://zhuanlan.zhihu.com/p/33540686
https://zhuanlan.zhihu.com/p/33587540
https://zhuanlan.zhihu.com/p/33619389

//www.greatytc.com/p/b69080c98a7a
//www.greatytc.com/p/2e3dc01a4680
https://cloud.baidu.com/doc/BML/ScenarioTutorial/3F.5C.E5.B9.BF.E5.91.8A.E7.82.B9.E5.87.BB.E7.8E.87.E9.A2.84.E4.BC.B0.html
https://juejin.im/entry/5ae19299f265da0b796495c6
https://blog.csdn.net/DanyHgc/article/details/78776558
https://juejin.im/entry/5ae19299f265da0b796495c6

协同过滤?Collaborative Filtering https://zh.wikipedia.org/wiki/%E5%8D%94%E5%90%8C%E9%81%8E%E6%BF%BE

参考资料:
推荐系统遇上深度学习
1.FM模型理论和实践
FM(Factorization Machine) 因子分解机, 嵌入矩阵?
2.FFM模型理论和实践
FFM(Field-aware Factorization Machine)
3.DeepFM模型理论和实践
4.多值离散特征的embedding解决方案
5.Deep&Cross Network模型理论和实践Deep&Cross Network
6.PNN模型理论和实践PNN,全称为Product-based Neural Network,认为在embedding输入到MLP之后学习的交叉特征表达并不充分,提出了一种product layer的思想,既基于乘法的运算来体现体征交叉的DNN网络结构。
7.NFM模型理论和实践
8.AFM模型理论和实践
9.评价指标AUC原理及实践
10.GBDT+LR融合方案实战
11.神经协同过滤NCF原理及实战
12.推荐系统中的EE问题及基本Bandit算法
13.linUCB方法浅析及实现
14.《DRN:A Deep Reinforcement Learning Framework for News Recommendation》
15.强化学习在京东推荐中的探索
16.解推荐系统中的常用评测指标
17.探秘阿里之MLR算法浅析及实现
18.秘阿里之深度兴趣网络(DIN)浅析及实现
19.探秘阿里之完整空间多任务模型ESSM
20.贝叶斯个性化排序(BPR)算法原理及实战
21.阶段性回顾
22.DeepFM升级版XDeepFM模型强势来袭!
23.大一统信息检索模型IRGAN在推荐领域的应用
24.深度兴趣进化网络DIEN原理及实战!
25.当知识图谱遇上个性化推荐

CTR预估(二)
LR与GBDT融合方案

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,607评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,239评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,960评论 0 355
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,750评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,764评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,604评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,347评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,253评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,702评论 1 315
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,893评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,015评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,734评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,352评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,934评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,052评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,216评论 3 371
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,969评论 2 355

推荐阅读更多精彩内容