北航推出TinyLLaVA-Video,有限计算资源优于部分7B模型,代码、模型、训练数据全开源
北京航空航天大学研究团队推出TinyLLaVA-Video轻量级视频理解框架。该框架整体参数量不超过4B,在多个视频理解基准测试上表现优异。项目全开源,涵盖模型权重、训练代码及数据集,支持灵活定制与拓展。通过采用简化架构和高效的数据处理方式,TinyLLaVA-Video在保持高性能的同时显著降低了计算资源需求,为资源有限的研究者提供了宝贵的实验平台,推动了小尺寸视频理解模型的发展。来源:https://mp.weixin.qq.com/s/e1zUm8dv445RjrDtedJh3Q
页:
[1]