想纠正LMM犯错?没用!NUS华人团队:最强o1反馈修正率不到50%

[复制链接]
周大 发表于 2025-3-16 14:32:53 | 显示全部楼层 |阅读模式
新加坡国立大学华人团队提出InterFeedback框架及InterFeedback-Bench,用于评估大规模多模态模型(LMM)的交互智能。研究发现,最先进的LMM通过人类反馈纠正错误的比例不足50%,但交互过程可显著提升其解题能力。实验表明,反馈质量至关重要,高质量反馈能有效促进模型改进,而低质量反馈可能损害性能。此外,不同模型在反馈学习中的表现存在明显差异。
来源:https://mp.weixin.qq.com/s/rlAEo1KsoheqJR1Z3mtqRA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-12 07:36 , Processed in 0.274359 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表