上交、智源、北大等提出空间大模型SpatialBot

[复制链接]
周大 发表于 2024-8-7 16:19:25 | 显示全部楼层 |阅读模式
斯坦福大学等机构的研究者提出了SpatialBot,一种能够通过RGB-Depth图像理解实现精确空间深度感知的大模型。为解决当前模型难以理解深度图的问题,团队设计了包含5万个样本的SpatialQA数据集,引导模型理解并利用深度信息。SpatialBot在多个测试中展现出卓越性能,接近GPT-4O水平。
来源:https://mp.weixin.qq.com/s/X1iqkkEMsop9DGCY08AfCw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 22:17 , Processed in 0.274354 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表