zz憨憨兽提出的问题_博问

回答数

20 求问大佬强化学习实验怎么使用线性逼近器和特征处理啊？

参考文献提到的是去中心化的AC算法，使用的是线性逼近，初始实验是在简单的网格环境中，后面想扩展到高维的实验环境（例如MPE），但是实验一直没效果，智能体完全没学到有效策略，我翻了很多的开源代码库，找不

zz憨憨兽
浏览(70) 2个月前

回答数

问题：最近在复现一篇完全去中心化的多智能体AC强化学习的论文，遇到的问题就是，原文Actor使用的是SGD优化器，Critic使用的是AMSGrad优化器。目前的情况是跑了MPE的simple spr

#强化学习#多智能体#去中心化

zz憨憨兽
浏览(132) 3个月前

zz憨憨兽
园豆:26

排名:1500名之外