周大 发表于 2025-2-8 16:03:59

图像生成推理大模型,港中文北大等联手破解画质提升难题

港中文等机构提出将思维链(CoT)应用于图像生成的新方法,显著提升自回归模型的生成质量,超越传统扩散模型。研究团队提出了潜力评估奖励模型(PARM)及其增强版PARM++,通过清晰度判断、潜力评估等步骤优化图像生成。实验表明,该方法在GenEval指标上整体提升达27%,特别是在物体数量、颜色等方面表现更优。
来源:https://mp.weixin.qq.com/s/WmNEAM5pnPP_u1kVyCw--w
页: [1]
查看完整版本: 图像生成推理大模型,港中文北大等联手破解画质提升难题