想纠正LMM犯错？没用！NUS华人团队：最强o1反馈修正率不到50%

周大发表于 2025-3-16 14:32:53

新加坡国立大学华人团队提出InterFeedback框架及InterFeedback-Bench，用于评估大规模多模态模型（LMM）的交互智能。研究发现，最先进的LMM通过人类反馈纠正错误的比例不足50%，但交互过程可显著提升其解题能力。实验表明，反馈质量至关重要，高质量反馈能有效促进模型改进，而低质量反馈可能损害性能。此外，不同模型在反馈学习中的表现存在明显差异。
来源：https://mp.weixin.qq.com/s/rlAEo1KsoheqJR1Z3mtqRA

页: [1]

靠浦ai课堂's Archiver

想纠正LMM犯错？没用！NUS华人团队：最强o1反馈修正率不到50%