后发先至,字节版 Sora 发布!10秒长度、多主体交互、一致性多镜头

[复制链接]
周大 发表于 2024-9-25 15:06:19 | 显示全部楼层 |阅读模式
字节跳动发布豆包大模型新功能,包括视频生成、音乐生成及同声传译。视频生成模型支持复杂语义理解和多主体交互,可生成长达10秒视频片段。音乐生成模型可从词曲唱生成高质量音乐,并支持多种风格。同声传译模型实现实时翻译,接近甚至超越人类同传水平。豆包大模型日均tokens使用量超过1.3万亿。
来源:https://mp.weixin.qq.com/s/sB1954RjddrOg10_FZrIIw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-18 08:53 , Processed in 0.307310 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表