周大 发表于 2025-8-19 14:45:10

通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力

通义千问Qwen于8月19日推出图像编辑模型Qwen-Image-Edit,该模型基于20B参数的Qwen-Image训练,具备对图片文字的精准编辑能力。通过Qwen2.5-VL和VAE Encoder分别实现语义与外观控制,使编辑兼具语义理解和视觉表现力。
来源:https://tech.ifeng.com/c/8lw9LIDyk4l
页: [1]
查看完整版本: 通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力