Meta斯坦福全新多模态Apollo，60分钟视频轻松理解！7B性能超越30B

周大发表于 2024-12-20 15:13:33

Meta与斯坦福大学合作，针对视频多模态大模型（LMM）开展全面研究。团队创建了高效基准ApolloBench，解决了现有基准冗余问题，使评估速度提升41倍。研究发现了驱动LMM性能的关键因素，并提出了新的训练调度和数据混合方法。通过优化视频采样、编码器选择等设计要素，开发的Apollo系列模型在多个基准上表现出色，其中Apollo-7B超越了参数量更大的模型。研究表明，中等规模模型的设计决策可以可靠地迁移到更大模型。
来源：https://mp.weixin.qq.com/s/sXYmyp2BJKgspql34wtaPw

页: [1]

靠浦ai课堂's Archiver

Meta斯坦福全新多模态Apollo，60分钟视频轻松理解！7B性能超越30B