后发先至，字节版 Sora 发布！10秒长度、多主体交互、一致性多镜头

周大发表于 2024-9-25 15:06:19

字节跳动发布豆包大模型新功能，包括视频生成、音乐生成及同声传译。视频生成模型支持复杂语义理解和多主体交互，可生成长达10秒视频片段。音乐生成模型可从词曲唱生成高质量音乐，并支持多种风格。同声传译模型实现实时翻译，接近甚至超越人类同传水平。豆包大模型日均tokens使用量超过1.3万亿。
来源：https://mp.weixin.qq.com/s/sB1954RjddrOg10_FZrIIw

		自动登录	找回密码
密码			立即注册

课程导航

后发先至，字节版 Sora 发布！10秒长度、多主体交互、一致性多镜头