中科院自动化所推出GThinker模型，首创"线索引导式反思"机制，多模态推理能力超越O4-mini

周大发表于 2025-7-19 15:27:39

多模态大模型在结构化任务中表现突出，但在通用视觉推理场景中仍面临瓶颈。中科院自动化研究所团队提出 GThinker，通过创新的「线索引导式反思」机制，实现“思考-反思-修正”的闭环推理流程，显著提升模型对视觉线索的校验与修正能力。该模型采用两阶段训练策略，结合监督微调与强化学习，在 M³CoT 基准及多个榜单上超越当前先进模型 O4-mini，达到 SOTA 水平。实验表明，GThinker 在 MMStar、RealWorldQA 等通用任务中表现优异，且在主流 10B 规模模型上平均提升约 1 个百分点，验证了其方法的泛化性与有效性。相关论文、数据与模型已开源。
来源：https://mp.weixin.qq.com/s/IYqTD5m5zRAPagNlecHHIQ

页: [1]

靠浦ai课堂's Archiver

中科院自动化所推出GThinker模型，首创"线索引导式反思"机制，多模态推理能力超越O4-mini