来自伊利诺伊大学厄巴纳-香槟分校的研究团队近日推出首个系统性评估多智能体协作与竞争能力的基准 **MultiAgentBench**,已被 ACL 2025 主会接收。该基准基于 MARBLE 框架,涵盖六种交互场景和多种协作协议,并引入任务得分(TS)、协作总分(CS)等综合评估指标。实验表明,个体能力仍是多智能体系统的基石,去中心化的“图结构”协作模式表现最优,而“认知自演化规划”显著提升任务完成率。研究还揭示了“林格曼效应”在 AI 团队中的存在,并首次观察到 AI 在博弈环境中自发形成的复杂社会行为,标志着 AI 研究正迈向理解“群体情商”的新阶段。
来源:https://mp.weixin.qq.com/s/JSLAJfQecN74kcwXMk9iTg