多模态大模型空间推理能力仍存瓶颈

[复制链接]
周大 发表于 2025-2-3 13:50:19 | 显示全部楼层 |阅读模式
研究表明,多模态大语言模型(MLLM)在空间推理方面仍存在明显不足,难以区分基本空间概念。空间推理对于实现环境导航、地图理解等实际应用至关重要。目前,包括谷歌、微软在内的多家企业和AI创企正在积极布局空间推理技术研发,探索从不同角度和方法来增强模型的空间推理能力。李飞飞创业公司World Lab发布了首个项目“使用单图生成3D世界”。这些进展表明,提升模型的空间推理能力是当前人工智能领域的关键挑战之一。
来源:https://mp.weixin.qq.com/s/-AGnkk0lLR6MuW2LgwZ6tA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 07:07 , Processed in 0.294632 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表