周大 发表于 前天 14:43

一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二

浙江大学与哈佛大学团队提出新图像编辑方法ICEdit,仅需0.1%数据量与1%训练参数即可实现高质量图像编辑。该方法基于Diffusion Transformer模型,通过上下文提示词让模型理解编辑指令,并采用两种免训练架构完成图像编辑任务。结合混合专家LoRA微调与test-time scaling策略,ICEdit性能显著提升,在人物ID保持及背景一致性方面媲美甚至超越商业大模型。
来源:https://mp.weixin.qq.com/s/WWAV6NrCLTlcQ6Iz5dZoyQ
页: [1]
查看完整版本: 一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二