中科院自动化所推出GThinker模型,首创"线索引导式反思"机制,多模态推理能力超越O4-mini

[复制链接]
周大 发表于 2025-7-19 15:27:39 | 显示全部楼层 |阅读模式
多模态大模型在结构化任务中表现突出,但在通用视觉推理场景中仍面临瓶颈。中科院自动化研究所团队提出 GThinker,通过创新的「线索引导式反思」机制,实现“思考-反思-修正”的闭环推理流程,显著提升模型对视觉线索的校验与修正能力。该模型采用两阶段训练策略,结合监督微调与强化学习,在 M³CoT 基准及多个榜单上超越当前先进模型 O4-mini,达到 SOTA 水平。实验表明,GThinker 在 MMStar、RealWorldQA 等通用任务中表现优异,且在主流 10B 规模模型上平均提升约 1 个百分点,验证了其方法的泛化性与有效性。相关论文、数据与模型已开源。
来源:https://mp.weixin.qq.com/s/IYqTD5m5zRAPagNlecHHIQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 12:12 , Processed in 0.285006 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表