周大 发表于 2025-3-2 15:06:52

V-JEPA:AI自监督学习物理直觉

Meta最新研究开发的视频联合嵌入预测架构(V-JEPA)实现了AI对直观物理的理解。与传统模型不同,V-JEPA无需硬编码核心知识,通过自监督学习在抽象表示空间中进行预测,成功分辨符合或违背物理定律的视频。实验结果显示,V-JEPA在多个数据集上的表现显著优于随机水平,特别是在物体持久性、连续性和形状恒定性方面。此外,V-JEPA不仅超越了基于像素的预测模型和多模态大型语言模型,在某些情况下甚至达到了或超过了人类的表现。研究表明,即使是较小规模的V-JEPA模型也能实现对直观物理的有效理解。
来源:https://mp.weixin.qq.com/s/OeUYyfEonlKlwQQEwhLVgg
页: [1]
查看完整版本: V-JEPA:AI自监督学习物理直觉