AI视觉空间智能新进展：VSI-Bench基准发布

周大发表于 2024-12-23 15:06:54

研究人员开发了VSI-Bench基准测试，评估MLLM的视觉空间智能。该基准涵盖近290个真实场景视频，含5000多个问答对。结果显示，尽管MLLM展现了新兴的视觉空间智能，但与人类仍存在较大差距，尤其在空间推理方面表现不佳。研究指出，语言提示技术对空间推理有害，MLLM主要形成局部世界模型。
来源：https://mp.weixin.qq.com/s/Z4Kv92fukfNTyE1tSpJslA

		自动登录	找回密码
密码			立即注册

课程导航

AI视觉空间智能新进展：VSI-Bench基准发布