周大 发表于 2025-7-19 15:27:39

中科院自动化所推出GThinker模型,首创"线索引导式反思"机制,多模态推理能力超越O4-mini

多模态大模型在结构化任务中表现突出,但在通用视觉推理场景中仍面临瓶颈。中科院自动化研究所团队提出 GThinker,通过创新的「线索引导式反思」机制,实现“思考-反思-修正”的闭环推理流程,显著提升模型对视觉线索的校验与修正能力。该模型采用两阶段训练策略,结合监督微调与强化学习,在 M³CoT 基准及多个榜单上超越当前先进模型 O4-mini,达到 SOTA 水平。实验表明,GThinker 在 MMStar、RealWorldQA 等通用任务中表现优异,且在主流 10B 规模模型上平均提升约 1 个百分点,验证了其方法的泛化性与有效性。相关论文、数据与模型已开源。
来源:https://mp.weixin.qq.com/s/IYqTD5m5zRAPagNlecHHIQ
页: [1]
查看完整版本: 中科院自动化所推出GThinker模型,首创"线索引导式反思"机制,多模态推理能力超越O4-mini