清华大学联合团队推出MindOmni模型,实现AI多模态推理生成新突破
清华大学与腾讯ARC Lab等机构合作开发的新大模型MindOmni,通过融合视觉理解和生成能力,显著提升了AI的推理生成水平。该模型基于Qwen2.5-VL构建,并采用三阶段训练策略,包括基础预训练、CoT监督微调及RGPO强化学习。实验结果显示,MindOmni在图像理解、文本到图像生成及推理生成任务中均超越现有方法,展现了其在多模态任务中的强大优势。来源:https://mp.weixin.qq.com/s/hTOHGoknh51rMqfziN1SEQ
页:
[1]