参考文献提到的是去中心化的AC算法,使用的是线性逼近,初始实验是在简单的网格环境中,后面想扩展到高维的实验环境(例如MPE),但是实验一直没效果,智能体完全没学到有效策略,我翻了很多的开源代码库,找不到使用线性逼近器的实验代码,不知道是自己的线性逼近器写的不对还是特征工程不行。