英伟达发布物理常识推理新模型Cosmos-Reason1
英伟达推出Cosmos-Reason1系列模型,专注于物理常识推理。该模型包含Cosmos-Reason1-8B和Cosmos-Reason1-56B两个版本,经过视觉预训练、通用SFT、物理AI SFT及强化学习四个阶段训练。实验显示,物理AI监督式微调使模型在物理常识和具身推理任务上表现优异,尤其56B版准确度超越OpenAI ο1。强化学习进一步提升模型空间、时间及物体持久性推理能力,使其能够识别反物理运动并准确判断无合适选项的情况。来源:https://mp.weixin.qq.com/s/4q94N0ulQv7HXGWH7Pd3vg
页:
[1]