周大 发表于 2025-6-28 15:46:23

阿里推出多模态模型Qwen VLo,支持精准P图、开放指令修改及多语言交互

阿里巴巴发布新一代多模态模型Qwen VLo,具备更强的理解与图像再创造能力。该模型支持自然语言指令编辑图片,可完成风格迁移、背景替换、多任务修改等操作,并兼容中英文等多语言输入。其创新的渐进式生成机制提升了图像质量和可控性,还可实现文本到图像生成、边缘检测、动态长宽比图像处理等功能。目前处于预览阶段,部分功能尚在优化中,未来有望拓展图像交互与内容理解的新应用场景。
来源:https://tech.ifeng.com/c/8kXtrRVjdkT
页: [1]
查看完整版本: 阿里推出多模态模型Qwen VLo,支持精准P图、开放指令修改及多语言交互