简单、合理、高效、稳定
最优项:用户最有可能感兴趣的新物品项。当评分值存在时,最优项可以定义为一个回归或者(多类)分类问题。学习一个函数来预测用户对新物品的评分。
--------------------------------------基于用户评分(本质上回归问题)------------------------------------------
用户 u 对新物品 i 的评分rui,利用和用户兴趣相近且对物品 i 作了评分的用户,这些和用户兴趣相近的用户称为近邻。用Wuv表示用户 u 和用户 v 的兴趣相近程度。N(u)用户u的k近邻。预测评分rui:
假设Lucy和Diane的近邻权重分别为 0.75 和0.15
------------------------------------------基于用户分类(分类)------------------------------------------
----------------------------------------------基于物品推荐--------------------------------------------
用户 u 对物品 i 的预测评分可以通过对用户Nu(i)中物品的评分进行加权平均运算。
假设 Tianic 的相似项 Forrest Gump 和Well-E 相似权重分别为0.85 和0.75
r=(0.85*5+0.75*4)/(0.85+0.15)≈4.53
近邻方法的要素
(1)评分标准化
均值中心化
Z-score标准化
(2)相似度权重计算
基于关联的相似度
(3)近邻的选择
过滤预选近邻数(Top-N 过滤,阈值过滤、负值过滤)
用于预测的近邻
==========================拓展======================================
降维方法(矩阵分解)
基于图方法(【图中两个点的距离较远,一个节点对另一个节点的影响较小:传播和衰减】基于路径的相似度、基于随机游走相似性)