推荐系统其实很简单

写在前面:本文主要针对推荐系统做一些整体介绍,由浅到深,开头絮叨,有助于初学者接受。后面会根据推荐系统各子支部分引出细节问题以及对应的解决方案。因推荐相关的文章满天飞,总觉得不够系统全面,在此我根据自己的体会进行整理和总结,与各位相互学习,大牛们勿喷,有理解不对之处请多指教。

背景

目前网络信息时代,信息分发的主要途径主要有两种:搜索推荐。理解这二者的区别有一个简单的准则,那就是有没有用户“主动”表达意愿。

只要用户有明确的“主动意愿”,即:用户内心已经有目标了,通过一定的信号表达出来,希望得到预期的结果就是搜索。比如:

  1. 在百度的框内输入query"天气预报"进行信息检索
  2. 自己根据商场指路牌寻找"阿迪专卖店"

这两种都是用户“搜索”行为,有直接的目标做为行动的指引 。
相反,以下两种就有些不同:

  1. 打开新闻看看发生了什么国内外新闻
  2. 去大商场随便逛逛放松一下身心

这两种行为都没有明确要消费内容,只是随便看看,不知道会发生哪些新闻、不知道商场里会有什么有意思的东西。这种场景我们称之为"推荐"场景(但不能说这是用户的推荐行为)。

只不过“搜索”一词一般是以用户为视角的,比如"用户在搜索什么"、"平台每天有多用户发起搜索"。 而“推荐”一词的视角偏重于平台,比如"给用户推荐什么", "平台推荐的质量如何",一般都是描述平台的,所以上面的两个例子可以说第一个例子是用户搜索行为但第二就只能说是平台的推荐场景。英文中搜索和推荐分别对应search 和feed(或者push), 二者的描述视角可以体会一下。

在这里我们重点说一下推荐系统,因为最近以推荐为分发方式的平台都取得了很大成功。相比于搜索,推荐的受众更广、更符合历史的趋势。3-90岁的人都可以用推荐平台消费信息,相比下搜索门槛就高多了。

但话说回来,推荐系统到底怎么做的?背后的逻辑是什么?推荐系统最核心的策略是如何?别急,接下来我们就开始分析。

推荐系统

价值是什么

既然是一个系统,那首先得了解这个系统的“价值”,这个系统用来干嘛的?解决什么矛盾的?我们知道但凡要了解一个事物的价值,就先把他扔到他所在的大环境中去。以更高视角和维度分析才看得更清,不至于横看成岭侧成峰。

推荐系统的大环境是什么?平台啊! 那就先看一下平台的价值是什么才能更好的理解推荐系统。来,解剖一下平台(这里是通用的,可以联想一下几大推荐平台,抖音、快手、今日头条几个大的app)。

  • 平台目标:赚钱。(好像是费话。别急!先强化一下意识,有利于故事展开)对应子目标就是:更快、更好、更持续性赚钱。

  • 整体方案:盘活各方需求,打通数据、流量、资金三条通路。用更好的物料吸引更多的用户,扩大自己的规模和影响力。(互联网时代的定律,“流量在哪里钱就在哪里”。不过现在有一个升级版更为合理:“用户在哪里钱就在哪里”。把流量换成了用户,这也是最近X度的战略,由“流量运营”改为“用户运营”,其中的差异各位细细品,不再赘述。)

image.png

这张图是最简单的原型图,实际要比这个复杂得多。比如,平台为了拉用户可以把钱给用户;同时为了吸引B端优质资源,平台可以直接和B端分钱等等。

其中平台如何做到“用更好的物料吸引更多的用户” 这里就体现了推荐策略的价值:从海量的物料中找到用户最喜爱的部分推荐给用户,把用户留下来

推荐面对的问题是什么

要做好一个推荐系统,就需要解答几个问题,如图:

image.png
  • 用户是什么样的:--了解用户需求
  • 物料是什么样子的:--知道自己能提供什么
  • 优化目标是什么:-- 推荐优化的方向和衡量标准
  • 约束条件是什么:-- 任何优化问题都有的约束文件

那每个项具体指的是什么内容呢?如下:

image.png

不论是推荐何种内容,向哪些人群推荐,也那种场景形式的推荐,都需要首先明确这几个问题。只有深刻理解了业务,才能系统性的进行优化,公式化抽象如下:

image.png
  • Y: Objective,业务目标,是系统优化的指导方向
  • F: 推荐策略,是系统优化的具体方法
  • Xu: User信号,用户信息,是系统优化的依赖
  • Xi: Item信号, 物料(或者资源)信息,是系统优化的依赖
  • Xc: Constraint约束条件,是系统优化面对的现实状况(有地方Xc代表context, 仅指推荐模型的特征维度。这里指的是整体的推荐系统的角度,而不单单是一个ctr/cvr模型)

接下来我们重点分析针对Y如何优化F,有个形象的比喻:推荐系统就是厨房,Xi是食材,Xc是炊具、锅灶, F是厨艺,Y是饭菜的色香味。

如何搭建推荐系统

推荐系统框架

推荐系统整体的思路就是打通物料到用户的分发通路,划分各环节功能,打通数据闭环。整体框架如下:

推荐系统策略

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,036评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,046评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,411评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,622评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,661评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,521评论 1 304
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,288评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,200评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,644评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,837评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,953评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,673评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,281评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,889评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,011评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,119评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,901评论 2 355