PhysVLM:融合物理知识的视频语言模型开源
PhysVLM团队发布了一款融合物理知识的大型视频语言模型PhysVLM,该模型在PhysGame基准上展现出最先进的性能,并在通用视频理解基准(Video-MME, VCG)上表现领先。PhysVLM在专门的数据集上训练,包括880个含有故障现象的游戏视频,涵盖力学、运动学、光学和材料属性四大物理领域。实验结果显示,PhysVLM在多个基准测试中均表现出色,特别是在PhysGame benchmark上比最佳专有模型GPT-4o高出3.4%的平均准确率。来源:https://mp.weixin.qq.com/s/5eZon0FBEkV6xWV29DxD2w
页:
[1]