首页 新闻 会员 周边
0
回答数

待解决问题 20 求问大佬强化学习实验怎么使用线性逼近器和特征处理啊?

参考文献提到的是去中心化的AC算法,使用的是线性逼近,初始实验是在简单的网格环境中,后面想扩展到高维的实验环境(例如MPE),但是实验一直没效果,智能体完全没学到有效策略,我翻了很多的开源代码库,找不
4
回答数

回答被采纳 200 DTDE架构的多智能体AC强化学习训练结果不收敛

问题:最近在复现一篇完全去中心化的多智能体AC强化学习的论文,遇到的问题就是,原文Actor使用的是SGD优化器,Critic使用的是AMSGrad优化器。目前的情况是跑了MPE的simple spr