周大 发表于 2024-6-17 15:45:11

xFinder:提升大语言模型评估准确性的新工具

上海算法创新研究院与中国人民大学合作,针对大语言模型(LLM)评估的准确性问题,推出了xFinder模型。研究表明,当前评估框架依赖的正则表达式方法存在抽取答案不准确的问题。xFinder模型能更准确、鲁棒地抽取关键答案,准确率超过95%,并在多样化题型中展现高一致性。实验验证了xFinder在多项任务上的优越性能,提升了LLM评估的可靠性。
来源:https://mp.weixin.qq.com/s/C5G-rpen9OM4MmBhrByTIQ
页: [1]
查看完整版本: xFinder:提升大语言模型评估准确性的新工具