CMU和Meta推出VQAScore和GenAI-Bench，提升AI图像生成评估

周大发表于 2024-11-6 14:24:00

CMU和Meta团队推出VQAScore和GenAI-Bench，旨在自动评估图像、视频和3D生成模型在复杂提示词下的表现。VQAScore利用生成式VQA模型（如GPT-4o）评估图像与文本提示的相似度，比现有指标如CLIPScore更精准。GenAI-Bench包含1600个复杂提示词，覆盖10种生成模型，配有80,000条人工标注，更具挑战性和细粒度技能分析。VQAScore在多个基准测试中表现优异，已被谷歌DeepMind用于评估Imagen3模型。GenAI-Rank使用VQAScore选择最佳候选图像，显著提升文生图模型的效果。
来源：https://mp.weixin.qq.com/s/rESmdlauhxVtlraxg8T4FA

		自动登录	找回密码
密码			立即注册

课程导航

CMU和Meta推出VQAScore和GenAI-Bench，提升AI图像生成评估