Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

[复制链接]
周大 发表于 3 天前 | 显示全部楼层 |阅读模式
Meta与斯坦福大学合作,针对视频多模态大模型(LMM)开展全面研究。团队创建了高效基准ApolloBench,解决了现有基准冗余问题,使评估速度提升41倍。研究发现了驱动LMM性能的关键因素,并提出了新的训练调度和数据混合方法。通过优化视频采样、编码器选择等设计要素,开发的Apollo系列模型在多个基准上表现出色,其中Apollo-7B超越了参数量更大的模型。研究表明,中等规模模型的设计决策可以可靠地迁移到更大模型。
来源:https://mp.weixin.qq.com/s/sXYmyp2BJKgspql34wtaPw

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-23 12:59 , Processed in 0.280674 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表