谷歌发布FACTS Grounding提升AI可靠性
谷歌发布FACTS Grounding基准测试,用于评估AI模型在特定上下文中生成准确文本的能力。该测试包含1719条数据,涵盖金融、技术等多领域,最大输入长度达32k个token。测试通过双维度评估模型输出的准确性和相关性,并使用三种大模型减少偏见。排除无效回复后,最终事实性得分更加客观。目前,gemini在排行榜中表现突出。这一基准有助于提升语言模型的事实准确性,推动AI技术发展。来源:https://mp.weixin.qq.com/s/PZIDIto8knXhElfB3PI95Q
页:
[1]