谷歌发布FACTS Grounding提升AI可靠性

周大发表于 2025-1-13 15:32:55

谷歌发布FACTS Grounding基准测试，用于评估AI模型在特定上下文中生成准确文本的能力。该测试包含1719条数据，涵盖金融、技术等多领域，最大输入长度达32k个token。测试通过双维度评估模型输出的准确性和相关性，并使用三种大模型减少偏见。排除无效回复后，最终事实性得分更加客观。目前，gemini在排行榜中表现突出。这一基准有助于提升语言模型的事实准确性，推动AI技术发展。
来源：https://mp.weixin.qq.com/s/PZIDIto8knXhElfB3PI95Q

页: [1]

靠浦ai课堂's Archiver

谷歌发布FACTS Grounding提升AI可靠性