清华领衔发布MultiTrust基准 全面评估多模态大模型可信度

[复制链接]
周大 发表于 2024-7-24 15:48:09 | 显示全部楼层 |阅读模式
清华大学朱军教授团队与多家机构合作,发布MultiTrust综合基准,首次全面评估主流多模态大语言模型的可信度。研究发现,闭源商用模型相比主流开源模型更为安全可靠,但所有模型仍存在对抗攻击、越狱攻击等安全可信风险。多模态训练和推理会削弱大语言模型的安全对齐机制,提示未来研究需关注模态间对齐及视觉编码器的鲁棒性等问题。
来源:https://mp.weixin.qq.com/s/jCFYuLB_1agdXk3VDi_HTw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-19 03:08 , Processed in 0.295100 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表