周大 发表于 2025-3-16 14:32:53

想纠正LMM犯错?没用!NUS华人团队:最强o1反馈修正率不到50%

新加坡国立大学华人团队提出InterFeedback框架及InterFeedback-Bench,用于评估大规模多模态模型(LMM)的交互智能。研究发现,最先进的LMM通过人类反馈纠正错误的比例不足50%,但交互过程可显著提升其解题能力。实验表明,反馈质量至关重要,高质量反馈能有效促进模型改进,而低质量反馈可能损害性能。此外,不同模型在反馈学习中的表现存在明显差异。
来源:https://mp.weixin.qq.com/s/rlAEo1KsoheqJR1Z3mtqRA
页: [1]
查看完整版本: 想纠正LMM犯错?没用!NUS华人团队:最强o1反馈修正率不到50%