REPA技术大幅提升扩散模型训练效率

[复制链接]
周大 发表于 2024-10-14 13:46:25 | 显示全部楼层 |阅读模式
纽约大学研究者谢赛宁提出REPA技术,简化训练扩散Transformer的过程,强调表征的重要性。Yann LeCun对该研究表示认可。实验显示,REPA大幅提升了模型训练效率和效果,收敛速度提高了17.5倍,并在生成质量上取得FID=1.42的最佳成绩。
来源:https://mp.weixin.qq.com/s/a725rxzvyQXqNJoL1NsMaA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 02:53 , Processed in 0.280635 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表