周大 发表于 2024-10-15 14:37:44

百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D

伊利诺伊理工大学等机构提出Robin3D,通过鲁棒指令数据生成引擎(RIG)生成大规模对抗性和多样化指令数据,解决了3D大语言模型(3DLLM)训练数据稀少的问题。Robin3D引入关系增强投射器和ID-特征捆绑技术,显著提升了模型在多个3D多模态学习基准测试中的性能,超越了先前方法。
来源:https://mp.weixin.qq.com/s/HTGo0NHy9QSPUYnTbH1ofQ
页: [1]
查看完整版本: 百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D