上海人工智能实验室开源了生成式世界模型 AETHER,该模型完全基于合成数据训练,首次赋予大模型 3D 空间决策与规划能力。AETHER 集成目标导向视觉规划、4D 动态重建和动作条件视频预测三大功能,并通过「重建—预测—规划」一体化框架显著提升空间推理准确性。实验表明,其视频一致性指标提升 4%,且在真实环境中展现出强大的零样本泛化能力。该模型在动态场景重建中达到 SOTA 水平,为具身智能系统提供技术支持。
来源:https://mp.weixin.qq.com/s/gt3LPcjH7zQkY45mFyYiDQ