腾讯混元开源AI绘画新框架:24维度对齐人类意图,让AI读懂复杂指令

[复制链接]
周大 发表于 2025-9-17 13:52:01 | 显示全部楼层 |阅读模式
腾讯混元团队推出并开源PromptEnhancer框架,通过思维链提示重写与24维度奖励模型,在不修改T2I模型权重的前提下,显著提升文本到图像的语义对齐精度。实验显示,在HunyuanImage 2.1等模型上,20个维度准确率提升,复杂场景最高提升达17.3%。同时发布的6000条标注数据集为提示优化研究提供了高质量基准,推动AI绘画向高可控性与专业化发展。
来源:https://mp.weixin.qq.com/s/xc2BwKapekVmDfpK2kscfw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 14:34 , Processed in 0.270808 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表