推荐模型可解释性

推荐算法中各种深度学习模型层出不穷，但是万变不离其宗，我们从最原始的矩阵分解模型MF谈起

矩阵分解模型

MF模型是求解方程 $UI^T=Z$ ，
Z是label矩阵，格式如下：
$\begin{bmatrix} 1&0&\text{x}&\cdots&0\\ 0&\text{x}&1&\cdots&\text{x}\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ \text{x}&0&1&\cdots&1\\ \end{bmatrix}$ ，其中 $z_{ij}=\begin{cases} 1,\, user_i点击了item_j\\ 0,\, user_i看过item_j但没有点击\\ \text{x},\,user_i未看过item_j,表示未知值\\ \end{cases}$

设user个数为n，item个数为m，向量大小为k，
U矩阵如下：
$\begin{bmatrix} U_1^1&U_1^2&U_1^3&\cdots&U_1^k\\ U_2^1&U_2^2&U_2^3&\cdots&U_2^k\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ U_n^1&U_n^2&U_n^3&\cdots&U_n^k\\ \end{bmatrix}$

其中每行为一个user的向量， $U_i$ 表示第i个用户的向量，每行的值如[0.2083438 0.6450492 0.30716872 ... 0.5020966 -0.24310756]

I矩阵如下：
$\begin{bmatrix} I_1^1&I_1^2&I_1^3&\cdots&I_1^k\\ I_2^1&I_2^2&I_2^3&\cdots&I_2^k\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ I_m^1&I_m^2&I_m^3&\cdots&I_m^k\\ \end{bmatrix}$

其中每行为一个item的向量， $I_i$ 表示第i个item的向量

求解方程如下：
$\begin{bmatrix} U_1^1&U_1^2&U_1^3&\cdots&U_1^k\\ U_2^1&U_2^2&U_2^3&\cdots&U_2^k\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ U_n^1&U_n^2&U_n^3&\cdots&U_n^k\\ \end{bmatrix} \times \begin{bmatrix} I_1^1&I_2^1&I_3^1&\cdots&I_m^1\\ I_1^2&I_2^1&I_3^2&\cdots&I_m^2\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ I_1^k&I_2^k&I_3^k&\cdots&I_m^k\\ \end{bmatrix} = \begin{bmatrix} 1&0&\text{x}&\cdots&0\\ 0&\text{x}&1&\cdots&\text{x}\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ \text{x}&0&1&\cdots&1\\ \end{bmatrix}$

最后是要求解U、I中的向量值，使 $UI^T$ 的积能够最大化拟合label矩阵Z中的已知值，然后通过求解出来的U、I值计算Z中的未知值，预测用户对未看过item的偏好。
用神经网络模型的术语，U、I分别代表user、item的embedding向量，Z为label
神经网络模型训练过程就是使user、item的embedding内积与label的交叉熵最小化，是不是有种似曾相识的感觉，其网络模型如下图：

模型1.png

在youtubednn和各种双塔模型中，网络最后一层都是类似的作用，其实就是为了拟合 $UI^T=Z$

矩阵分解改进

在MF模型中，有多少个用户就有多少行user embedding向量，他们之间是互不相关的，一般推荐系统的用户量都是百万至千万的量级，这导致用户侧的向量个数特别大。我们知道，在方程求解中，自变量个数越多，求解越难。为了减少用户变量的个数，我们可以考虑用用户的一些基本特征来表示用户，最简单的如年龄、性别。年龄个数最大不会超过200，性别个数不会超过3，他们之间的组合个数最大也就600，比起原来动辄百万的量级大大减少了。这其实就是youtubednn的最简化版本了。其网络模型如下图：

模型2.png

其中mlp层是在age和gender中添加非线性组合更好的表示用户

YoutubeDnn模型

上面对用户的建模有点过于简单了，相同性别和年龄的人并一定会有相同的兴趣，难道你和你的同学都喜欢看相同的内容吗。所以我们要加入更多的特征来刻画用户。比较重要的特征有用户最近看过的item 列表，想想相同年龄和性别的人，如果最近又看过相同的内容，是不是这两个人有相同兴趣的概率大大增加了。但是一个用户看过的item列表是多个，怎么把多个item的特征加入到用户向量里呢，简单的直接取列表里item embedding的平均值就行了，其中的item embedding与I中是共享的，并没有增加整个方程的自变量个数，却大大增加了用户的区分度，是不是比较巧妙，其实这就是youtubednn原型了。其网络模型如下图：

youtubednn.png

从上面的讨论中，我们也可以得到一些选取特征的方法，选取的特征一定要对业务目标有区分度，选取的特征太少不具备区分度，太多会使求解方程变难，也就是模型难拟合。比如做国内业务的场景，用户国籍这种特征就没必要加进来。

DSSM模型

聪明的读者看到这里一定会想到既然用户侧可以用各种特征来表示用户，item侧是不是也可以这样呢。对的，item侧也可用比如tag标签、title、作者等特征来表示item，这其实就是各种双塔模型如dssm了。其网络模型如下图：

dssm.png

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,734评论 6赞 505
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,931评论 3赞 394
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,133评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,532评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,585评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,462评论 1赞 302
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,262评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,153评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,587评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,792评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,919评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,635评论 5赞 345
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,237评论 3赞 329
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,855评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,983评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,048评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,864评论 2赞 354

推荐模型可解释性

矩阵分解模型

矩阵分解改进

YoutubeDnn模型

DSSM模型

推荐阅读更多精彩内容