周大 发表于 2025-9-17 13:52:01

腾讯混元开源AI绘画新框架:24维度对齐人类意图,让AI读懂复杂指令

腾讯混元团队推出并开源PromptEnhancer框架,通过思维链提示重写与24维度奖励模型,在不修改T2I模型权重的前提下,显著提升文本到图像的语义对齐精度。实验显示,在HunyuanImage 2.1等模型上,20个维度准确率提升,复杂场景最高提升达17.3%。同时发布的6000条标注数据集为提示优化研究提供了高质量基准,推动AI绘画向高可控性与专业化发展。
来源:https://mp.weixin.qq.com/s/xc2BwKapekVmDfpK2kscfw
页: [1]
查看完整版本: 腾讯混元开源AI绘画新框架:24维度对齐人类意图,让AI读懂复杂指令