AgentAuditor: 让智能体安全评估器的精确度达到人类水平

[复制链接]
周大 发表于 2025-6-27 13:50:19 | 显示全部楼层 |阅读模式
随着 LLM 智能体向自主决策与复杂任务执行发展,其安全评估面临评估工具不足的挑战。现有基于规则或大模型的方法难以全面识别交互过程中的潜在风险。为此,来自纽约大学等多所高校的研究团队推出 AgentAuditor——一种免训练的记忆增强推理框架,结合结构化记忆与检索强化推理,显著提升评估精度,在 ASSEBench 等基准测试中表现接近甚至超越人类专家水平。同时,研究团队构建了包含 2293 条标注数据的新基准 ASSEBench,涵盖广泛的风险类型与应用场景,填补了领域空白。
来源:https://mp.weixin.qq.com/s/eQhsQ3ttUkZRNtQ5Jf8bVg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-7-6 05:12 , Processed in 0.291734 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表