英伟达发布物理常识推理新模型Cosmos-Reason1

周大发表于 2025-3-25 14:05:15

英伟达推出Cosmos-Reason1系列模型，专注于物理常识推理。该模型包含Cosmos-Reason1-8B和Cosmos-Reason1-56B两个版本，经过视觉预训练、通用SFT、物理AI SFT及强化学习四个阶段训练。实验显示，物理AI监督式微调使模型在物理常识和具身推理任务上表现优异，尤其56B版准确度超越OpenAI ο1。强化学习进一步提升模型空间、时间及物体持久性推理能力，使其能够识别反物理运动并准确判断无合适选项的情况。
来源：https://mp.weixin.qq.com/s/4q94N0ulQv7HXGWH7Pd3vg

页: [1]

靠浦ai课堂's Archiver

英伟达发布物理常识推理新模型Cosmos-Reason1