周大 发表于 2025-8-28 14:53:17

腾讯混元开源端到端AI模型Hunyuan-Foley:视频+文字=“电影级”音效

腾讯混元开源端到端视频音效生成模型 Hunyuan-Foley,可根据视频与文字输入生成电影级音效,打破 AI 视频无声局限。该模型依托约 10 万小时高质量数据训练,实现音画一致、语义对齐的音频生成,适用于短视频、影视、广告、游戏等场景,显著提升视频沉浸感与真实感。
来源:https://tech.ifeng.com/c/8mBVZvJEq4P
页: [1]
查看完整版本: 腾讯混元开源端到端AI模型Hunyuan-Foley:视频+文字=“电影级”音效