周大 发表于 2024-6-7 16:00:01

快手「可灵」视频生成模型:2分钟超长视频,精准模拟物理世界

快手近日推出产品级AI视频生成模型“可灵”,可生成长达2分钟、1080p分辨率的视频,模拟真实物理运动。采用Transformer架构,3D VAE网络和全注意力机制强化时空建模,此外,快手构建了高质量数据筛选和视频描述模型,以优化训练效果。目前,可灵已在快影APP中启动邀测。
来源:https://mp.weixin.qq.com/s/-knHZA4AU47EkkzIO7O18A
页: [1]
查看完整版本: 快手「可灵」视频生成模型:2分钟超长视频,精准模拟物理世界