首页
新闻
会员
周边
园子
·
关注
·
粉丝
·
会员
·
随便看看
·
消息
欢迎,请先
登录
或者
注册
。
登录
/
注册
闪存
提问
博问
博客
投递
新闻
添加
收藏
文库
问题反馈
问题列表
我关注的
我的博问
博问标签
提问
回答
被采纳
0
回答数
20
求问大佬强化学习实验怎么使用线性逼近器和特征处理啊?
参考文献提到的是去中心化的AC算法,使用的是线性逼近,初始实验是在简单的网格环境中,后面想扩展到高维的实验环境(例如MPE),但是实验一直没效果,智能体完全没学到有效策略,我翻了很多的开源代码库,找不
4
回答数
200
DTDE架构的多智能体AC强化学习训练结果不收敛
问题:最近在复现一篇完全去中心化的多智能体AC强化学习的论文,遇到的问题就是,原文Actor使用的是SGD优化器,Critic使用的是AMSGrad优化器。目前的情况是跑了MPE的simple spr
zz憨憨兽
园豆:6
排名:1500名之外
博问搜索
关于博问
»
博问帮助
»
发现问题
»
我有建议