![Avatar notebook default](https://cdn2.jianshu.io/assets/default_avatar/avatar-notebook-default-640f7dde88592bdf6417d8ce1902636e.png)
7篇文章 · 8496字 · 8人关注
我们已经介绍完AlphaGo所需要的设计思想。鉴于算力不足,我们很难通过自己的破电脑跑出一个打败李世石的AlphaGo来,要知道谷歌旗下的Dee...
上一节我们构造出如下结构的神经网络: 本节我们看看如何使用该网络训练围棋机器人。我们在标题中提到Q-Learning,它实际上是一种使用上面网络...
上一节我们完成了围棋机器人,也就是Agent,它所面临的环境就是当前棋盘状况。Agent有自己的“脑子”,也就是它自己附带着一个经过人类棋手所产...
上一节我们介绍了什么叫增强式学习,它的模型值得我们印刻在脑海里: 我们要打造一个Agent,也就是智能机器人,它运作在一个给定环境中。它每次与环...
上一节,我们从围棋服务器中下载大量棋谱,并将其转换成网络可以解析的数据格式,在神经网络的开发中完成了最繁琐的一步,也就是数据准备。接下来我们将创...
知己知彼,百战不殆。我们要打造一个能胜过人类的机器人,就必须要让机器人掌握人类的围棋思维模式,因此我们就需要使用人类棋手留下的棋盘数据训练机器人...
上一节,我们使用基于蒙特卡洛树搜索的机器人来自我对弈,同时我们把机器人落子方式和落子时的棋盘编码记录下来,本节我们就使用上一节数据来训练神经网络...
文集作者