超越免训练剪枝:LightVLA引入可微分token剪枝,首次实现VLA模型性能和效率的双重突破

[复制链接]
周大 发表于 4 天前 | 显示全部楼层 |阅读模式
清华大学与中科院团队联合提出LightVLA,一种新型视觉token剪枝框架,在LIBERO基准上以平均97.4%的任务成功率刷新SOTA,同时将视觉token从512压缩至78个,FLOPs和延迟分别下降59.1%与38.2%,并反向提升成功率2.6%。该方法通过无参数可微分剪枝与Gumbel-softmax实现任务自适应的关键信息提取,首次验证了VLA模型中效率与性能可协同优化,为具身智能系统的轻量化部署提供了新路径。
来源:https://mp.weixin.qq.com/s/qzozyaHoEqFzCKLkZX-qNg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 11:41 , Processed in 0.333042 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表