周大 发表于 2024-4-27 18:38:07

Vidu:基于U-ViT架构的视频大模型

国内公司生数科技发布视频大模型「Vidu」,突破视频领域,生成效果接近 Sora,具备镜头语言、时间和空间一致性等能力,背后团队来自清华大学,采用自研技术 U-ViT 架构。
来源:https://mp.weixin.qq.com/s/xAEYGIoJ0EzhszfmXno3UA
页: [1]
查看完整版本: Vidu:基于U-ViT架构的视频大模型