清华与南洋理工联合推出AudioTrust：全球首个音频大模型六维安全评估基准

周大发表于 2025-6-3 14:12:34

南洋理工与清华大学的研究团队推出了首个专为音频大语言模型（ALLMs）设计的多维度可信度评估基准——AudioTrust。该框架涵盖公平性、幻觉、安全性、隐私、鲁棒性和身份验证六大核心维度，基于4,420+条真实场景数据进行评估。研究发现，闭源模型在多个维度上表现更佳，而开源模型在安全防护和隐私保护方面存在明显不足。AudioTrust通过自动化评估流程，揭示了当前ALLMs在高风险任务中的脆弱环节，如系统性偏见和鲁棒性缺失，为后续研究提供了重要参考。这一成果已公开发布，助力ALLMs领域的进一步发展。
来源：https://mp.weixin.qq.com/s/gKifSw2iQs7VHLtjhGk-Tg

页: [1]

靠浦ai课堂's Archiver

清华与南洋理工联合推出AudioTrust：全球首个音频大模型六维安全评估基准