腾讯开源混元图生视频模型引热议
近日,AI领域竞争激烈,阿里凌晨发布Qwen QwQ 32B模型后,腾讯迅速跟进,宣布开源混元图生视频模型。该模型可将图片按创意转化为2K清晰度的视频,支持“对口型”、“跳舞”等高级玩法,并上传至Huggingface和Github供用户使用。实测表明其生成效果较好,基本符合物理规律,但在细节处理上仍存在一些问题。此模型采用预训练的Decoder-Only架构多模态大语言模型作为文本编码器,以增强图像语义理解能力。来源:https://mp.weixin.qq.com/s/bfy8CddDIyKHotNHVLoNOQ
页:
[1]