PsySafe:跨学科视角下的Agent系统安全性研究

[复制链接]
周大 发表于 2024-6-14 15:42:22 | 显示全部楼层 |阅读模式
上海人工智能实验室与大连理工大学、中国科技大学合作,研究大模型安全,特别是智能体安全。随着大型语言模型的广泛应用,智能体系统可能构建微型社会,但其安全性引发关注。研究团队提出了PsySafe框架,通过心理评测预测危险行为,并设计了输入端、心理和角色防御策略来应对安全问题。研究显示,心理评测可有效预测Agent的危险倾向。
来源:https://mp.weixin.qq.com/s/zKg5JDWKrGoKyCuZ7VtFoA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-19 13:13 , Processed in 0.306091 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表