KIEval与FreeEval：破解大模型评估难题

周大发表于 2024-7-2 16:02:50

北京大学等研究者针对大语言模型评估中的数据污染问题，推出KIEval动态交互式评估框架和FreeEval工具包。KIEval通过多轮对话评估模型的知识理解和应用能力，而FreeEval提供高效灵活的评估环境，两者结合能更全面、客观地评估模型性能，弥补现有评估方法的不足。
来源：https://mp.weixin.qq.com/s/4B-LeceLgEfeeLAbcBzcMg

页: [1]

靠浦ai课堂's Archiver

KIEval与FreeEval：破解大模型评估难题