周大 发表于 2025-1-5 15:04:12

多智能体强化学习算法评估Hard模式来了!浙大、南栖仙策联手推出

浙江大学与南栖仙策联合开发的SMAC-HARD环境,针对多智能体强化学习(MARL)提出新挑战。该环境通过引入可编辑、随机化对手策略及自博弈接口,克服了传统SMAC环境中单一默认脚本导致的过拟合问题,提升了模型训练的稳定性和泛化能力。研究团队对五个经典算法进行了测试,结果显示这些算法在SMAC-HARD中难以保持高胜率,暴露出现有算法在面对多样化对手时的局限性。此外,SMAC-HARD还提供了黑盒测试模式以评估算法的迁移能力,并修正了原SMAC环境中的奖励结算错误,为MARL领域提供了更具挑战性的研究平台。
来源:https://mp.weixin.qq.com/s/CP7HCUh5qNZ_QBTo1E5pyQ
页: [1]
查看完整版本: 多智能体强化学习算法评估Hard模式来了!浙大、南栖仙策联手推出