首页 新闻 会员 周边
1
回答数

待解决问题 200 DTDE架构的多智能体AC强化学习训练结果不收敛

问题:最近在复现一篇完全去中心化的多智能体AC强化学习的论文,遇到的问题就是,原文Actor使用的是SGD优化器,Critic使用的是AMSGrad优化器。目前的情况是跑了MPE的simple spr