多智能体强化学习算法评估Hard模式来了！浙大、南栖仙策联手推出

周大发表于 2025-1-5 15:04:12

浙江大学与南栖仙策联合开发的SMAC-HARD环境，针对多智能体强化学习（MARL）提出新挑战。该环境通过引入可编辑、随机化对手策略及自博弈接口，克服了传统SMAC环境中单一默认脚本导致的过拟合问题，提升了模型训练的稳定性和泛化能力。研究团队对五个经典算法进行了测试，结果显示这些算法在SMAC-HARD中难以保持高胜率，暴露出现有算法在面对多样化对手时的局限性。此外，SMAC-HARD还提供了黑盒测试模式以评估算法的迁移能力，并修正了原SMAC环境中的奖励结算错误，为MARL领域提供了更具挑战性的研究平台。
来源：https://mp.weixin.qq.com/s/CP7HCUh5qNZ_QBTo1E5pyQ

页: [1]

靠浦ai课堂's Archiver

多智能体强化学习算法评估Hard模式来了！浙大、南栖仙策联手推出