写文章
注册
登录
首页
下载App
会员
IT技术
发简信
布谷AI
0
关注
0
粉丝
1
文章
649
字数
2
收获喜欢
0
总资产
IP属地:北京
文章
动态
最新评论
热门
布谷AI
强化学习 优势函数(Advantage Function)
什么是优势函数 优势函数表达在状态s下,某动作a相对于平均而言的优势。从数量关系来看,就是随机变量相对均值的偏差。使用优势函数是深度强化学习极其重要的一种策略,尤其对于基于p...
2652
0
2
布谷AI
个人介绍
专注机器学习,探索人工智能。
他关注的专题/文集/连载
他喜欢的文章