最近Google收购的DeepMind的AlphaGo向韩国李世石九段发起了挑战,看了各方比赛的视频,谈点感受。
1.AlphaGo与李世石比赛是否公平?
资源上:AlphaGo输入了历史上相当多的高手对决的棋谱,并且自己下棋对弈进行强化学习,资源上AlphaGo占据了绝对优势。
学习成本上:AlphaGo学习的进度相对于人类的学习进度,是指数级的差别。可能机器两个月下的棋局就会相当于一个高手一辈子的总棋局数。当相对来说可以忽略时间的时候,成长的进度AlphaGo完虐李世石。机器一旦开始进化,人类赶上的机会就微乎其微了。
沟通代价上:AlphaGo内部有Policy Network和Value Network,有全局观和当前下哪步棋的更优搜索解。如果打破资源上的不公平,让很多人类顶尖高手对局AlphaGo,沟通的成本有多大?在读秒阶段能应承得来么?而AlphaGo只需要加CPU,内存,优化进程就可以了。
2.AlphaGo的局限在哪里?
AlphaGo基于大量数据的决策,是完全不懂下棋而又能下赢人类的,学习方式是前所未有的,人类也很难学会的,但有个致命的弱点,AlphaGo只能学会已有的技能,这次是围棋,下次是星际争霸……并没有Original Learning的能力,这个技能学习模式注定了它只能在人类已知的认知范围内争霸,并不会突破人类认知的盲区,没有人类的情感,发明创造能力。