KIEval与FreeEval:破解大模型评估难题

[复制链接]
周大 发表于 2024-7-2 16:02:50 | 显示全部楼层 |阅读模式
北京大学等研究者针对大语言模型评估中的数据污染问题,推出KIEval动态交互式评估框架和FreeEval工具包。KIEval通过多轮对话评估模型的知识理解和应用能力,而FreeEval提供高效灵活的评估环境,两者结合能更全面、客观地评估模型性能,弥补现有评估方法的不足。
来源:https://mp.weixin.qq.com/s/4B-LeceLgEfeeLAbcBzcMg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-19 10:52 , Processed in 0.295444 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表