腾讯开源混元图生视频模型引热议

[复制链接]
周大 发表于 2025-3-7 15:46:57 | 显示全部楼层 |阅读模式
近日,AI领域竞争激烈,阿里凌晨发布Qwen QwQ 32B模型后,腾讯迅速跟进,宣布开源混元图生视频模型。该模型可将图片按创意转化为2K清晰度的视频,支持“对口型”、“跳舞”等高级玩法,并上传至Huggingface和Github供用户使用。实测表明其生成效果较好,基本符合物理规律,但在细节处理上仍存在一些问题。此模型采用预训练的Decoder-Only架构多模态大语言模型作为文本编码器,以增强图像语义理解能力。
来源:https://mp.weixin.qq.com/s/bfy8CddDIyKHotNHVLoNOQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-20 01:59 , Processed in 0.320374 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表