DeepMind推出FLAMe系列自动评估模型

[复制链接]
周大 发表于 2024-8-2 14:37:01 | 显示全部楼层 |阅读模式
谷歌DeepMind推出FLAMe系列自动评估模型,用于评估大型语言模型的性能。FLAMe-RM-24B在RewardBench上以87.8%的准确率领先GPT-4o。该系列模型克服了人工评估的局限性,使用公开许可的数据集进行训练,并在多个自动评分器评估基准上表现出色。计算高效的多任务训练方法和尾部补丁微调策略被引入以优化性能。FLAMe系列模型在多个基准上的表现优于流行基线模型,并显示出低偏见的特点。
来源:https://mp.weixin.qq.com/s/k182lwGFycz20LcHmuwZ1A

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-10 00:22 , Processed in 0.293630 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表