输给算法狗不冤
1997年,深蓝战胜了卡斯帕罗夫
2017年,阿尔法狗战胜了柯洁
在我初入百度时,系统里还有很多的陈年的人工规则
在现在这个时刻,百度公布Q2财报,其信息流业务DAU 破亿,全面转向人工智能
作为RD+PM,我坚信的是:在给定的框架和目标下,人类可枚举出的规则是远逊于机器学习得来的模型的。
举个例子,如下图:
- 产品最直观能够想到的策略如图中直线,简单但覆盖面积小
- 为了提升覆盖面,将策略增加了许多自判断,从而构成了图中的折线
- 完成了上面两步,人脑能够实现的复杂度基本上到顶了。想要拿剩下的收益,只能依靠机器。图中的曲虚线,即可以视作机器习得的模型。
火车已然高速,就真的别再执念你的宝马良驹了。
不管你认不认可,机器学习大面积取代人工判断的时代,来了!
训练算法狗才重要
先讲个真实的段子。
问:“点击率优化,你做了什么?”
我一脸的茫然:“点击率优化,算法狗做的啊。”
追问:“那要策略产品干什么?”
是啊,要策略产品干什么?当然不是去跟算法狗比速度,而是应该养狗、训狗啊。
设定目标。
机器擅长做的是数据优化,产品就需要给机器设定出合理的优化目标。
在另一篇文章中也有描述,基本上可以概括为:确定产品和业务的核心指标,以灵敏指标拟合长期目标。
目前,由于机器可以支持更好的复杂度,产品迭代已经渐逐步从单目标向多目标沟通。如,我需要在不降低点击率的前提下,优化互动量(分享、评论、点赞),在互动量中,更重要的是分享的部分……
草拟方案。
机器的优化不是一蹴而就的,在机器算法未完善前,人工应该能够给出一个保底的方案作为对照组。
以反低俗为例,在系统识别不好的时候,通过用户举报反馈、规则识别、数据异常波动复审等方式,可以拦截一部分低俗内容。以此作为产品层的基准,留给机器学习和优化的时间。
发现问题。
与其说是发现机器的问题,不如说是发现制定目标时,缺乏限定的问题。
在机器优化的过程中,往往会出现为了极致优化目标A,造成其他部分有损的情况。
比如,目标设定的是优化用户的阅读完成度,那么机器执行后最直接的结果就是只推荐短文,一屏展现完毕,点击进去就100%阅读完成度。这结果显然不是我们想要的,为了优化,我们就需要进一步修正目标的设定方式,比如内容至少要大于多少字,对哪些内容可豁免(如快讯)等等。
好的算法结果,离不开优秀技术的实现,同样离不开优秀产品的投入。
输给算法狗不冤,训练出一只好的算法狗才重要。