Google DeepMind发布全新机器人AI模型Gemini Robotics On-Device,首次实现完全离线运行,集成视觉、语言与动作控制于一体。该模型基于VLA架构,用户可通过自然语言指令让机器人自主执行任务,如拉开拉链、叠衣服等,仅需50至100次演示即可快速学习。相比云端方案,其本地部署显著降低延迟,提升稳定性,适用于医疗、工业自动化等场景。模型具备良好适配性,可迁移至多种机器人平台,但仍在安全判断与多步骤逻辑规划方面存在局限。目前该模型已面向开发者开放试用权限。
来源:https://www.huxiu.com/article/4504949.html