字节豆包大模型团队的研究发现,尽管视频生成模型可以生成看似符合常识的视频,但它们无法真正理解物理规律。图灵奖得主 Yann LeCun 和 Keras 之父 François Chollet 曾对此表示质疑。研究团队通过大规模实验发现,即使扩大模型参数和数据量,模型仍无法抽象出物理规则,如牛顿第一定律和抛物线运动。实验结果显示,模型在分布内泛化表现良好,但在分布外泛化和组合泛化中表现不佳,更多依赖于记忆和案例模仿,而非抽象出普遍的物理规则。
来源:https://mp.weixin.qq.com/s/mwm6UgJByVOdnZHIgcMngA