港科广与字节联合推出ComfyMind框架,性能媲美GPT-4o,一键搞定多类视觉生成任务
港科大(广州)与字节合作开发的开源框架ComfyMind,实现从文本到图像、图像到视频等多模态视觉生成任务的统一处理。其性能在多个基准测试中超越现有开源方法,接近闭源GPT-4o-Image水平。通过语义工作流接口与树状规划策略,ComfyMind显著提升生成质量与稳定性,在ComfyBench、GenEval和Reason-Edit测试中表现出色,相关资源已全面开放。来源:https://mp.weixin.qq.com/s/5Ib66RMMXV6Od2wkZjIGng
页:
[1]