腾讯混元开源端到端AI模型Hunyuan-Foley：视频+文字=“电影级”音效

周大发表于 2025-8-28 14:53:17

腾讯混元开源端到端视频音效生成模型 Hunyuan-Foley，可根据视频与文字输入生成电影级音效，打破 AI 视频无声局限。该模型依托约 10 万小时高质量数据训练，实现音画一致、语义对齐的音频生成，适用于短视频、影视、广告、游戏等场景，显著提升视频沉浸感与真实感。
来源：https://tech.ifeng.com/c/8mBVZvJEq4P

页: [1]

靠浦ai课堂's Archiver

腾讯混元开源端到端AI模型Hunyuan-Foley：视频+文字=“电影级”音效