周大 发表于 2024-12-27 15:41:35

中国信通院联合淘天集团发布全球首个中文安全领域事实性基准评测集

大语言模型(LLMs)广泛应用带来安全性挑战。中国信通院与淘天集团联合发布全球首个针对中文安全领域的评测集Chinese SafetyQA,包含2000个问答对,聚焦中国法律法规、道德标准等内容。评测显示,模型参数规模与安全知识表现正相关,中国企业开发的模型在中文场景下更具优势。该评测集有助于提升LLMs在复杂应用场景中的可靠性和安全性,并为后续研究提供重要参考。
来源:https://mp.weixin.qq.com/s/3YKY5TwiFr3voCXAlj4SwA
页: [1]
查看完整版本: 中国信通院联合淘天集团发布全球首个中文安全领域事实性基准评测集