字节视频生成新突破!Phantom搞定多人物/主体一致性

[复制链接]
周大 发表于 2025-3-1 16:25:34 | 显示全部楼层 |阅读模式
字节智能创作团队推出主体一致性视频生成模型Phantom,该模型可精准抓取人物、物品等多主体关键特征并自然融入视频,在人脸ID一致性等方面具优势。Phantom支持单、多参考主体视频生成,高度还原细节。它基于DiT框架,通过构建文本-图片-视频三元组数据学习模态对齐,实现主体到视频的生成,平衡文本和图像提示,为视频生成提供新思路。
来源:https://mp.weixin.qq.com/s/2dAdu3sN4LpMvSzheHQdCw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-20 03:58 , Processed in 0.286098 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表