DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成
JanusFlow由Deepseek、北大、港大及清华团队开发,通过融合解耦的视觉编码器和基于Rectified Flow的生成框架,实现了视觉理解和生成能力的有效统一。该模型基于1.3B规模的LLM,通过端到端训练,显著提升了视觉理解和生成任务的性能。实验结果显示,JanusFlow在多项评测标准上超越了同规模的其他模型。来源:https://mp.weixin.qq.com/s/NLk9JUJskvCIy7IiMCQAUw
页:
[1]