今天,有位资深米粉问“PatchWall一周年生日,你们有庆祝活动吗?” 突然意识到对我们的米粉来说,PatchWall已经是他们生活的一部分。但是节前团队太忙,没有时间去策划庆祝活动。想了想,还是写一篇文章吧,算是给米粉的PatchWall生日礼物,讲一些不为人知的背后小故事。
PatchWall一周年
去年的今天,我们发布了小米的第二代智能电视系统「PatchWall拼图墙」,采用杂志式排版、无限下拉瀑布流的风格化精准内容推荐,懂内容更懂你,结合小米大脑的前沿技术,全速拥抱人工智能,是小米首款人工智能电视系统。
一年来,借助小米大脑,PatchWall从深度内容理解和人工智能精准推荐开始,逐步加入了更多人工智能的功能,人工智能语音、智能搜索、人脸识别... 爱学习的PatchWall不断在进步,小米大脑越聪明,PatchWall也越聪明,陆续学会了很多技能。比如,听你的话去找电影,你可以说“我想要看关于骑行的电影“,“我想看美国的科幻电影,不要惊悚的,要斯皮尔伯格导演的”,“我想看关于会说话的动物的电影”;再比如,查天气,查股价,购物,玩游戏...;为了广大儿童用户,还学会了儿童模式,变身育儿专家 …
借助小米大脑的水滴平台,PatchWall学到的技能会越来越多,为此,我们专门为他搭建了Skill Store,让大家可以快速了解他的学习成果。
这一年还要特别感谢背后的米粉。PatchWall的迭代速度非常快,甚至有过一周几更,荣誉内测群的小伙伴们周而复始不辞辛苦地给我们找BUG、提建议、汇总问题,帮我们从内测群和论坛收集各种问题并整理成内测反馈文档,充当小米的志愿者客服帮其他用户解答问题,甚至在我们犯了错误的时候包容我们、为我们辩护。只有这时,你才能深刻体会到阿黎《参与感》里说的“用户模式大于一切工程模式”的真正含义。所以,谁是最可爱的人?在小米,我们认为米粉是最可爱的人。
当然,PatchWall被称为“懂内容更懂你”,这并不只是一句口号,我们几年前就开始为这个目标努力,这首先要从我们对内容的认知过程开始。
内容是有深度的
从2013年多看阅读时代,我们就开始构建图书和电影的推荐系统,当然也借鉴了之前业界很多成功的解决方案,最著名的当属亚马逊2003年公布的著名技术报告“Amazon.com Recommendations: Item-to-Item Collaborative Filtering”。但在构建过程中我们发现我们面对的问题和亚马逊的问题并不完全相同,差别之处主要在内容的深度上。
对于商品类内容来说,比如一件衣服,内容本身比较简单,用户感知和消费的过程也是比较直接的,我们称之为浅层内容 (Shallow Content)。比如,衣服好不好看或合不合身,用户的感受是很直接的。
对于创作类内容来说,比如一部电影,内容本身是层次的,而且表达手段多种多样,用户的感知和消费过程也是比较复杂的,我们称之为深度内容 (Deep Content)。比如红楼梦这本书,不同人眼中有不同的红楼梦。再比如大话西游这部电影,可以说是关于爱情,关于理想,关于修行,甚至是关于救世的。同一部作品以不同角度、不同方式甚至不同时间去欣赏往往展示出不同的内涵,恰如一千多年前苏轼诗中所说的“横看成岭侧成峰,远近高低各不同”。
解构深度内容
关于深度内容,2013年NIPS上就有过一篇关于音乐推荐的论文“Deep content-based music recommendation”,通过深度人工神经网络从音频信号种构建多层次特征来帮助音乐推荐。Spotify在2014年对此方法进行了实验: Recommending music on Spotify with deep learning。所以,这个想法并不新鲜,关键是如果把它落地并产品化。
深度内容如此复杂,所以对深度内容的理解也是很有挑战的。为了更好的刻画深度内容,我们把深度内容解构为8万个维度,每个维度我们称为一个微标签,每个微标签描述了深度内容的一个层面,或者说是一个要素。
微标签也是有层次的,比如,有关于主题的,有关于角色身份的,有关于情绪的,有关于背景年代的,有关于拍摄手法的。更重要的,随着对内容理解的不断深入,微标签的数量也在不断增长。
基于微标签体系,我们可以实现更精准且更有趣的推荐系统。我们发现推荐理由对于深度内容的推荐是非常重要的,而从内容的不同层面会产生不同的推荐理由。微标签可以通过一定的算法自动组合生成各种有趣的推荐理由。每个推荐理由我们称为一个facet,就像钻石的一个切面一样,可以透视出内容的不同视角,比如,主角一开始就死了的电影, 男主角拥有超能力的电影,有末日情结的电影,文艺青年必修的电影。推荐理由可以让深度内容的以更丰富的形式展现出来,构成了PatchWall延绵不绝的推荐流。
懂内容所以更懂你
基于对深度内容的解构,我们对用户的理解也更进一步,甚至比用户自己更了解自己的观影口味。你可能不知道自己喜欢的电影很多都是超自然恐怖片,或者是角色充满女性魅力的电影,借助这些深度的内容标签,可以发现用户喜欢的影片之间有趣的关联,帮助用户找到自己潜在喜欢的内容。
从实验室原型开始
2014年6月我在内部启动了一个代号为XMDb的项目,没错,就是Xiaomi Movie Database。从名字也能看出,我们希望借鉴IMDb的想法,构建一个电影的知识库,起初只是帮助解决我们在内容聚合上遇到的数据质量问题,但后来逐步意识到要解构深度内容,我们需要构建一个面向多种内容类型的知识图谱。
众所周知,知识图谱构建是一个费时费力的过程,需要大量领域专家的人工。成本控制和ROI是决定知识图谱项目能否成功的核心要素,所以,必须找到提高杠杆率的方法。为此,我们的构建过程是半自动和迭代的,首先机器整合大量的数据,借助算法进行自动处理后再由人进行精细加工,机器再利用人加工过的知识去优化自动处理过程,如此不停迭代进化,从而保证人力成本的收敛,甚至很长一段时间内,其实只有一个全职的内容编辑(这位美女也是以前多看阅读的天才文案)。我们也很早就尝试了深度学习技术,因为它非常适合用来理解多层次的深度内容(至少代替部分人力),在我们构建知识图谱的过程中,深度学习被用来构造更好的特征以产生更多的微标签维度。
经过快半年的迭代,知识图谱已经足够丰富,和小戈、康哥讨(y)论(y)过多次,总觉得要做点什么出来。直到2014年底前的两周,好像是12月22日,一个确实比较2的周一,经历了一个找很久也没找到想看电影的糟糕周末后,突发奇想,为什么不利用我们的知识图谱开发一个找电影的服务呢?恰逢新产品开发完成后的冬歇期,立马开动,日夜兼程。一周后,一款山寨了当时当红的Palantir公司名字的名为Movie Palantir的原型在公司内网上线。Palantir在指环王中是一个具有强大魔力的水晶球,从这个名字也能看出,这个原型是希望像巫师使用水晶球一样一句话达成所愿(其实后来觉得应该用一个更具中国特色的名字——如意)
值得一提的是,这个原型的前端设计其实颇费了一番心思。当时正在看《如何高效学习》这本书,书中提到知识结构就像一份地图,或者一座城市,在城市中有很多建筑物,建筑物之间有道路相连,有些建筑与城市中的其他建筑有上百条路相连,而其他一些建筑只有少数泥泞的小道与外界相通。所以,本想实现一种徒步城市的体验,一次点击就如同往前走了一步,转过了一个街角,眼前的风景就发生了变化,看到了新的感兴趣的地点,而这些地点之间又有着微妙的关联。但限于前端实现的复杂度,最后还是选择了朴素的实现方式来模拟这种感受。
后来的很多个周末,我都是使用Movie Palantir来找到自己想看的电影。但这个原型更重要的作用是引发了一系列关于内容发现和呈现的思考:
甚至创造了一个很奇怪的伪学科——电影解剖学
我发现这个问题其实非常复杂,同时为了发动更多人加入到这个知识图谱的项目贡献力量,于是便发起成立了一个“民间”组织——小米电视内容实验室,并且秉承我米“让每个人都能享受科技的乐趣”的价值观,以“让每个人都能享受内容的乐趣”作为实验室的使命和口号。
理想很美好,现实很骨感,在随后的产品化过程中我们发现,受第一代电视系统的设计语言和UI框架能力的限制,虽然尝试了很多种产品功能,但似乎都不够理想。
PatchWall扬帆起航
2016年初,小米电视掌舵人王川内部召集了一个“特种部队”小组,启动开发第二代小米智能电视系统,随后命名为PatchWall。PatchWall的核心理念是人工智能驱动+内容优先(Content First)+产品定义运营的信息流设计,相比一代,设计语言有了更强的表达能力,UI框架也更加灵活,更重要的,有了小米大脑加持,让原型里粗糙的实现替换为最前沿的人工智能技术。川总给我的第一个要求就是实现可无限下拉的瀑布流式的精准内容推荐,那一刻,我知道深度内容的力量借助PatchWall终于可以释放。