视频生成无损提速:删除多余token,训练时间减少30%,帧率越高效果越好

[复制链接]
周大 发表于 2024-11-17 13:55:41 | 显示全部楼层 |阅读模式
卡内基梅隆大学提出了一种名为Run-Length Tokenization(RLT)的视频生成模型加速方法,被NeurIPS 2024选为Spotlight论文。RLT通过合并视频中连续相同的图像块,显著减少输入token数量,从而在几乎不损失精度的情况下,将训练时间缩短30%,推理速度提升67%。对于30fps视频,训练速度甚至可提升1倍,长视频训练token减少80%。相比传统剪枝方法,RLT表现出更好的加速效果和更低的精度损失。
来源:https://mp.weixin.qq.com/s/Oe3t_d1A52bymWpv6i2CHA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-26 17:28 , Processed in 0.277538 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表