DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成

周大发表于 2024-11-22 14:31:48

JanusFlow由Deepseek、北大、港大及清华团队开发，通过融合解耦的视觉编码器和基于Rectified Flow的生成框架，实现了视觉理解和生成能力的有效统一。该模型基于1.3B规模的LLM，通过端到端训练，显著提升了视觉理解和生成任务的性能。实验结果显示，JanusFlow在多项评测标准上超越了同规模的其他模型。
来源：https://mp.weixin.qq.com/s/NLk9JUJskvCIy7IiMCQAUw

页: [1]

靠浦ai课堂's Archiver

DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成