腾讯开源混元图生视频模型引热议

周大发表于 2025-3-7 15:46:57

近日，AI领域竞争激烈，阿里凌晨发布Qwen QwQ 32B模型后，腾讯迅速跟进，宣布开源混元图生视频模型。该模型可将图片按创意转化为2K清晰度的视频，支持“对口型”、“跳舞”等高级玩法，并上传至Huggingface和Github供用户使用。实测表明其生成效果较好，基本符合物理规律，但在细节处理上仍存在一些问题。此模型采用预训练的Decoder-Only架构多模态大语言模型作为文本编码器，以增强图像语义理解能力。
来源：https://mp.weixin.qq.com/s/bfy8CddDIyKHotNHVLoNOQ

页: [1]

靠浦ai课堂's Archiver

腾讯开源混元图生视频模型引热议