多机构联合首次提出“自动化失败归因”课题,解决LLM多智能体系统故障定位难题

[复制链接]
周大 发表于 前天 16:05 | 显示全部楼层 |阅读模式
针对LLM Multi-Agent系统中常见的任务失败问题,宾夕法尼亚州立大学与杜克大学联合Google DeepMind等机构首次提出“自动化失败归因”研究课题。他们构建了首个专用数据集Who&When,包含127个系统的失败日志及人工标注,用于开发和评估归因方法。研究提出了三种方法(All-at-Once、Step-by-Step、Binary Search),但实验表明其准确性有限,最佳单一方法识别责任Agent的准确率仅为53.5%,定位错误步骤的准确率低至14.2%。尽管组合方法可提升性能,但代价高昂。该研究揭示了任务的复杂性,并为未来提升Multi-Agent系统的可靠性提供了方向。
来源:https://mp.weixin.qq.com/s/6bmoyg2Pho28rYzgjdbFYA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-13 10:15 , Processed in 0.278734 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表