VLA模型推动具身智能新发展

[复制链接]
周大 发表于 2025-4-20 15:17:24 | 显示全部楼层 |阅读模式
VLA(视觉-语言-动作模型)作为多模态技术的重要分支,在2025年初迎来快速发展。谷歌、英伟达、微软等头部企业以及Figure AI、银河通用等创业团队相继发布各自VLA模型,展现了在机器人控制任务上的优越性能。VLA起源于谷歌DeepMind的RT-2模型,其多模态特性使其在复杂环境中具备更强的灵活性与泛化能力。中科院自动化所研究者进一步总结了VLA的五种技术方案,而Sergey Levine团队提出的π0模型则被视为“通用机器人策略”,为行业发展提供了新方向。
来源:https://mp.weixin.qq.com/s/w5p_6b8P8AnPfWg6lTmcJw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 12:22 , Processed in 0.298829 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表