周大 发表于 2024-8-7 16:19:25

上交、智源、北大等提出空间大模型SpatialBot

斯坦福大学等机构的研究者提出了SpatialBot,一种能够通过RGB-Depth图像理解实现精确空间深度感知的大模型。为解决当前模型难以理解深度图的问题,团队设计了包含5万个样本的SpatialQA数据集,引导模型理解并利用深度信息。SpatialBot在多个测试中展现出卓越性能,接近GPT-4O水平。
来源:https://mp.weixin.qq.com/s/X1iqkkEMsop9DGCY08AfCw
页: [1]
查看完整版本: 上交、智源、北大等提出空间大模型SpatialBot