多智能体强化学习算法评估Hard模式来了!浙大、南栖仙策联手推出

[复制链接]
周大 发表于 2025-1-5 15:04:12 | 显示全部楼层 |阅读模式
浙江大学与南栖仙策联合开发的SMAC-HARD环境,针对多智能体强化学习(MARL)提出新挑战。该环境通过引入可编辑、随机化对手策略及自博弈接口,克服了传统SMAC环境中单一默认脚本导致的过拟合问题,提升了模型训练的稳定性和泛化能力。研究团队对五个经典算法进行了测试,结果显示这些算法在SMAC-HARD中难以保持高胜率,暴露出现有算法在面对多样化对手时的局限性。此外,SMAC-HARD还提供了黑盒测试模式以评估算法的迁移能力,并修正了原SMAC环境中的奖励结算错误,为MARL领域提供了更具挑战性的研究平台。
来源:https://mp.weixin.qq.com/s/CP7HCUh5qNZ_QBTo1E5pyQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-22 03:14 , Processed in 0.294105 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表