周大 发表于 2025-8-6 14:52:14

谷歌DeepMind发布Genie 3世界模型:支持720p实时交互,可生成动态虚拟环境

谷歌 DeepMind 发布第三代通用世界模型 Genie 3,首次实现基于文本提示的实时交互式环境生成,支持每秒 24 帧、720p 分辨率的动态世界构建,并可在数分钟内保持环境一致性。该模型在物理模拟、自然与幻想场景生成、历史探索等方面表现出色,同时支持“可提示世界事件”增强交互表现力。Genie 3 已与智能体 SIMA 联合测试,为具身智能研究提供虚拟训练平台。目前仍存在行动空间有限、地理精度不足等局限,将先以研究预览形式面向部分学者开放。
来源:https://tech.ifeng.com/c/8lZTJPcmgpU
页: [1]
查看完整版本: 谷歌DeepMind发布Genie 3世界模型:支持720p实时交互,可生成动态虚拟环境