周大 发表于 2024-10-5 15:41:48

Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功

Meta推出Movie Gen,包括30B参数的Video模型与13B参数的Audio模型,可生成高质量视频和音频。Video模型支持1080p、16秒、16帧/秒视频生成,“流匹配”技术使其效果优于扩散模型。Audio模型生成高保真音频,支持视频同步。Meta还发布92页技术报告详细介绍相关技术,并计划明年向公众开放。
来源:https://mp.weixin.qq.com/s/8Y9Ab4EdIjjyP1JRMkYcqA
页: [1]
查看完整版本: Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功