北航推出TinyLLaVA-Video，有限计算资源优于部分7B模型，代码、模型、训练数据全开源

周大发表于 2025-2-10 13:47:16

北京航空航天大学研究团队推出TinyLLaVA-Video轻量级视频理解框架。该框架整体参数量不超过4B，在多个视频理解基准测试上表现优异。项目全开源，涵盖模型权重、训练代码及数据集，支持灵活定制与拓展。通过采用简化架构和高效的数据处理方式，TinyLLaVA-Video在保持高性能的同时显著降低了计算资源需求，为资源有限的研究者提供了宝贵的实验平台，推动了小尺寸视频理解模型的发展。
来源：https://mp.weixin.qq.com/s/e1zUm8dv445RjrDtedJh3Q

页: [1]

靠浦ai课堂's Archiver

北航推出TinyLLaVA-Video，有限计算资源优于部分7B模型，代码、模型、训练数据全开源