周大 发表于 2024-12-20 15:13:33

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta与斯坦福大学合作,针对视频多模态大模型(LMM)开展全面研究。团队创建了高效基准ApolloBench,解决了现有基准冗余问题,使评估速度提升41倍。研究发现了驱动LMM性能的关键因素,并提出了新的训练调度和数据混合方法。通过优化视频采样、编码器选择等设计要素,开发的Apollo系列模型在多个基准上表现出色,其中Apollo-7B超越了参数量更大的模型。研究表明,中等规模模型的设计决策可以可靠地迁移到更大模型。
来源:https://mp.weixin.qq.com/s/sXYmyp2BJKgspql34wtaPw
页: [1]
查看完整版本: Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B