CMU和Meta推出VQAScore和GenAI-Bench,提升AI图像生成评估

[复制链接]
周大 发表于 2024-11-6 14:24:00 | 显示全部楼层 |阅读模式
CMU和Meta团队推出VQAScore和GenAI-Bench,旨在自动评估图像、视频和3D生成模型在复杂提示词下的表现。VQAScore利用生成式VQA模型(如GPT-4o)评估图像与文本提示的相似度,比现有指标如CLIPScore更精准。GenAI-Bench包含1600个复杂提示词,覆盖10种生成模型,配有80,000条人工标注,更具挑战性和细粒度技能分析。VQAScore在多个基准测试中表现优异,已被谷歌DeepMind用于评估Imagen3模型。GenAI-Rank使用VQAScore选择最佳候选图像,显著提升文生图模型的效果。
来源:https://mp.weixin.qq.com/s/rESmdlauhxVtlraxg8T4FA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-29 23:48 , Processed in 0.276731 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表