生数科技Vidu 1.5突破视频生成多主体一致性难题

[复制链接]
周大 发表于 2024-12-3 15:36:05 | 显示全部楼层 |阅读模式
2024年,视频生成技术取得重大突破,Sora基于DiT架构提升了长视频生成效果,而国内生数科技的Vidu 1.5则在全球率先突破了视频模型的多主体一致性难题。Vidu 1.5的核心在于“上下文能力”,能够理解多张图片输入并维持多个主体之间的一致性。生数科技认为视频是实现通用多模态模型的关键,具备更高的智能上限。该技术将对影视、情感陪伴等行业带来重大影响,实现更自然的多模态交互。生数科技在创业过程中注重技术创新和目标明确,与大厂相比有更早的认知和判断。
来源:https://mp.weixin.qq.com/s/VR0XWm3RiacxpCyOoh_lng

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-24 04:18 , Processed in 0.271914 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表