PhysVLM:融合物理知识的视频语言模型开源

[复制链接]
周大 发表于 2024-12-7 14:33:45 | 显示全部楼层 |阅读模式
PhysVLM团队发布了一款融合物理知识的大型视频语言模型PhysVLM,该模型在PhysGame基准上展现出最先进的性能,并在通用视频理解基准(Video-MME, VCG)上表现领先。PhysVLM在专门的数据集上训练,包括880个含有故障现象的游戏视频,涵盖力学、运动学、光学和材料属性四大物理领域。实验结果显示,PhysVLM在多个基准测试中均表现出色,特别是在PhysGame benchmark上比最佳专有模型GPT-4o高出3.4%的平均准确率。
来源:https://mp.weixin.qq.com/s/5eZon0FBEkV6xWV29DxD2w

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-24 00:00 , Processed in 0.559223 second(s), 45 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表