谷歌发布FACTS Grounding提升AI可靠性

[复制链接]
周大 发表于 2025-1-13 15:32:55 | 显示全部楼层 |阅读模式
谷歌发布FACTS Grounding基准测试,用于评估AI模型在特定上下文中生成准确文本的能力。该测试包含1719条数据,涵盖金融、技术等多领域,最大输入长度达32k个token。测试通过双维度评估模型输出的准确性和相关性,并使用三种大模型减少偏见。排除无效回复后,最终事实性得分更加客观。目前,gemini在排行榜中表现突出。这一基准有助于提升语言模型的事实准确性,推动AI技术发展。
来源:https://mp.weixin.qq.com/s/PZIDIto8knXhElfB3PI95Q

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 19:44 , Processed in 0.298378 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表