周大 发表于 2025-6-3 14:12:34

清华与南洋理工联合推出AudioTrust:全球首个音频大模型六维安全评估基准

南洋理工与清华大学的研究团队推出了首个专为音频大语言模型(ALLMs)设计的多维度可信度评估基准——AudioTrust。该框架涵盖公平性、幻觉、安全性、隐私、鲁棒性和身份验证六大核心维度,基于4,420+条真实场景数据进行评估。研究发现,闭源模型在多个维度上表现更佳,而开源模型在安全防护和隐私保护方面存在明显不足。AudioTrust通过自动化评估流程,揭示了当前ALLMs在高风险任务中的脆弱环节,如系统性偏见和鲁棒性缺失,为后续研究提供了重要参考。这一成果已公开发布,助力ALLMs领域的进一步发展。
来源:https://mp.weixin.qq.com/s/gKifSw2iQs7VHLtjhGk-Tg
页: [1]
查看完整版本: 清华与南洋理工联合推出AudioTrust:全球首个音频大模型六维安全评估基准