前言
- 发表在Recsys2016,是比较经典的基于图嵌入思想的推荐算法
摘要
文中提出了“基于查询的推荐”的概念,允许用户在探索新项目时指定他/她的搜索意图,从而将信息检索的概念融入推荐系统。
此外,当用户的意图可以用不同的方式表达,以音乐推荐为例: 推荐系统允许用户通过指定曲目、专辑或艺术家来发现新的歌曲曲目。为了在推荐系统空间中实现这种异构查询,提出了一种新的技术,称为“异构偏好嵌入” Heterogeneous Preference Embedding”,将用户偏好和查询意图编码到低维向量空间中。然后,通过简单的搜索方法或相似度计算,我们可以使用查询的编码表示来生成推荐。
模型方法
基于查询的推荐可以定义为如下形式,给定用户和查询,从物品列表I中计算各物品得分。将查询意图和用户-物品偏好情况统一考虑。
为了简单起见,本文仅关注查询意图部分,并将其设置为 α = 0。我们的目标是表明,所提出的嵌入方法可以利用用户偏好记录,与一般MF模型相比能够更好地从用户的查询意图并融合到隐含特征的学习中。
从基于查询的推荐的角度出发,我们尝试将各种信息视为查询,研究将任意类型的信息合并到推荐模型中。
下面介绍具体模型设计:
HPE: 异构偏好嵌入模型
1. 构建用户偏好网络
构建如上的异构图,在基本的用户-物品二部图的上引入辅助信息(side-information),即其他辅助信息如专辑/歌手等信息,有点简单的知识图谱内味儿。
2. 边采样 Edge sampling via Weighted Random Walks
从基础的图嵌入思想出发,为了得到图上节点的嵌入/特征向量,需要对图进行随机游走/采样,构建节点序列:常见的如DeepWalk采用随机游走生成训练样本,LINE采用边采样。
文中首先采用边采样来快速获取直接向量的关系对,然后使用加权随机游走策略来发现节点非直接相联的关系节点。
3. 模型训练
图中节点表征表示为,可以将非直接相连的节点视为中心节点的上下文信息,与word2vec中的中心词与上下文相对应。可以表示为:(skip-gram模式)
同word2vec的训练相同,采用负采样的方式进行优化训练。
大致流程如下所示,其中没有突出负采样的过程。
模型测试时由于本文考虑最简单的情况,只利用查询信息来生成推荐,即根据用户的查询记录利用嵌入来匹配物品。
实验结果
小结
- 结合实际常见构建偏好网络,将众多辅助信息融入其中;
- 并利用图嵌入的思想,借助word2vec方式进行训练嵌入训练;
- 得到的节点嵌入实际上融入了用户偏好信息,在实际使用中直接可以用查询和物品嵌入来进行评分生成,得到推荐列表。
- 总体上属于前几年利用图结构进行用户/物品嵌入学习的思想,模型简单易懂。
END
本人简书所有文章均为原创,欢迎转载,请注明文章出处 。百度和各类采集站皆不可信,搜索请谨慎鉴别。技术类文章一般都有时效性,本人习惯不定期对自己的博文进行修正和更新,因此请访问本人简书主页查看最新信息//www.greatytc.com/u/40d14973d97c