首先拉到上帝视角谈谈信息检索(Information Retireval)。信息检索是人类的一大基础需求,在互联网时代意味着流量入口和钱。大到整个互联网的信息,小到应用里某个功能页面的信息,都在信息检索的范畴内。帮助用户快速找到需要的信息通常是做好一个产品的第一步。人类发现信息的方式通常有三种:
主动发现:
一个人心理有明确的目标,找到什么信息。比如你加班饿了,想买一桶桶装的康帅傅(故意的)红烧牛肉面:(1)熟悉附近环境的你,可能直接走到最近的便利店,找到靠内柜台的下方,拿起泡面走人。映射到线上的情况,就是什么老司机的你,夜深人静的时候默默在浏览器地址栏里面输入了烂熟于心的网址,一个回车键;(2)如果你对周围不太数据,你可能走到一家超市。根据指引走到食品的货架前从前往后扫,直到发现方便面的货架。然后找到康帅傅的架子,再拿起红烧牛肉面。映射到线上的情况就是,你打开网址导航,找到对应的分类,最后再分类中找到目标网站。这种现在看来有点笨的方式在互联网刚开始的时候非常方便(现在对于一些输入困难用户仍有奇效),由此成就了巨头雅虎;(3)还有一种办法就是你问了一个附近的同事,同事给了你几个选择,并推荐你去楼下的便利店,你照做了,迅速找到了嘴馋多时的面。这种方式映射到线上的情况就是搜索,你在搜索框里输入"XX社区",然后一个回车,点击页面上的第一个结果(注意不要点到广告!)。同样,这种更快捷的信息查找方式成就了一个更强大的互联网巨头-谷歌。
被动接受:
一个人心理没有明确目标,但是又想找个点信息消费。比如你加班饿了,想吃点东西解解馋,你来到一家大型超市:(1)首先你发现超市门口就有很多特价促销的食品,薯片刚好是你的最爱,于是你直接拿走,映射到线上体验就是,你来到一个网站,看到首页的banner图很吸引人,直接就点击了;(2)你觉得薯片不太健康,不是最近长肉的你应该吃的,所以你来到食品区,一番对比找到了自己想要的食物。映射到线上的情况就是作为军事爱好者的你打开网站的军事频道,细细浏览了一番。前面两种方式的组合从另一个方面成就了雅虎,也就是门户网站;(3)
混合模式:
同样一个人心理没有明确目标,但是又想找个点信息消费,而在混合模式中不一样的是,信息供应方对信息需求方有一定了解,并且愿意通过这些了解为用户提供定制的服务,让用户被动接收的信息都是他们感兴趣的,跟用户主动搜索的体验接近。比如你加班饿了,想吃点东西解解馋,你来到一家大型超市:(1)你发现薯片旁边放着就是可乐,刚好都是你最常卖的食物,于是你一把拿走。对应到线上体验,你在亚马逊上本来想买本产品经理相关的书,结果发现下面的组合套餐更优惠,于是一起买了;(2) 你又发现拐角处的巧克力正是昨天朋友跟你天花乱坠夸了一通的那一款,干脆买一包尝尝。映射到线上体验,你昨天微博上关注了几个用户,因为这些好友都是你朋友关注的。
回想自己的日常生活,没有明确目标地浏览信息是非常常见的行为。对比被动模式和混合模式,显然混合模式的体验更佳。现实生活中收到物理资源的限制,商家很难为单一的顾客提供个性化的服务,而这一限制在互联网的世界里荡然无存,软件产品可以做到千人千面而没有太多额外的成本。为了更好地提供混合模式的信息检索服务,推荐系统营运而生。那么怎么定义推荐系统(Recommender System)?
推荐系统是向用户建议合适的信息的技术
从定义本身出发,我们可以看到推荐系统里涉及到的三个主要元素:用户、(合适的)场景和信息。这里的信息取决于用户的需求,包括真实的物品(如亚马逊的图书推荐),或是内容(今日头条的新闻和视频推荐、网易云音乐的音乐推荐),或者某个人(微博的好友推荐),甚至是个性化的广告(阿里妈妈的淘宝广告)等等。下面我们进一步明确推荐系统的目标,它能给产品的提供方和使用方分别带来什么?