用短视频成本生成长视频,字节Seed新注意力机制让计算量降低85%

[复制链接]
周大 发表于 2025-9-2 14:04:34 | 显示全部楼层 |阅读模式
字节Seed与斯坦福等机构联合提出一种名为Mixture of Contexts(MoC)的新模型,用于高效生成长视频。MoC通过稀疏注意力机制,将视频生成重构为上下文检索任务,使生成一分钟480P视频的计算量从1.66×10¹³FLOPs降至2.32×10¹²FLOPs,削减85%。在多镜头和单镜头视频中也分别节省约86%和78%的计算资源,同时在主题一致性、动作连贯性等关键指标上优于基线模型。MoC通过动态分块、路由机制及工程优化,提升了长视频生成的效率与稳定性,为长视频生成提供了新思路。
来源:https://mp.weixin.qq.com/s/0JTfrSnf76WrmpchpCcrhQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 17:12 , Processed in 0.360734 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表