周大 发表于 2024-7-2 16:02:50

KIEval与FreeEval:破解大模型评估难题

北京大学等研究者针对大语言模型评估中的数据污染问题,推出KIEval动态交互式评估框架和FreeEval工具包。KIEval通过多轮对话评估模型的知识理解和应用能力,而FreeEval提供高效灵活的评估环境,两者结合能更全面、客观地评估模型性能,弥补现有评估方法的不足。
来源:https://mp.weixin.qq.com/s/4B-LeceLgEfeeLAbcBzcMg
页: [1]
查看完整版本: KIEval与FreeEval:破解大模型评估难题