xFinder：提升大语言模型评估准确性的新工具

周大发表于 2024-6-17 15:45:11

上海算法创新研究院与中国人民大学合作，针对大语言模型（LLM）评估的准确性问题，推出了xFinder模型。研究表明，当前评估框架依赖的正则表达式方法存在抽取答案不准确的问题。xFinder模型能更准确、鲁棒地抽取关键答案，准确率超过95%，并在多样化题型中展现高一致性。实验验证了xFinder在多项任务上的优越性能，提升了LLM评估的可靠性。
来源：https://mp.weixin.qq.com/s/C5G-rpen9OM4MmBhrByTIQ

页: [1]

靠浦ai课堂's Archiver

xFinder：提升大语言模型评估准确性的新工具