谷歌推出开源LMEval框架，简化AI模型评测，跨平台无缝运行且降本增效

周大发表于 2025-5-28 14:22:20

谷歌推出了开源框架 LMEval，旨在解决大语言模型和多模态模型评测中的标准化难题。该框架通过 LiteLLM 抹平不同平台接口差异，支持文本、图像、代码等多领域测试，并引入 Giskard 安全评分以评估模型安全性。LMEval 提供增量评估和多线程处理功能，有效降低时间和计算成本，同时其可视化工具 LMEvalboard 能直观展示模型表现，助力研究人员精准定位问题并优化模型性能。
来源：https://tech.ifeng.com/c/8jhJNUUjnVW

页: [1]

靠浦ai课堂's Archiver

谷歌推出开源LMEval框架，简化AI模型评测，跨平台无缝运行且降本增效