周大 发表于 2024-11-22 14:31:48

DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成

JanusFlow由Deepseek、北大、港大及清华团队开发,通过融合解耦的视觉编码器和基于Rectified Flow的生成框架,实现了视觉理解和生成能力的有效统一。该模型基于1.3B规模的LLM,通过端到端训练,显著提升了视觉理解和生成任务的性能。实验结果显示,JanusFlow在多项评测标准上超越了同规模的其他模型。
来源:https://mp.weixin.qq.com/s/NLk9JUJskvCIy7IiMCQAUw
页: [1]
查看完整版本: DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成