周大 发表于 2025-3-1 16:18:49

3D意图定位助力智能交互

一项新研究引入了3D意图定位任务,旨在通过自然语言指令在3D场景中检测目标物体。与传统3D视觉定位不同,该方法基于用户意图自动推理目标,无需明确描述。研究人员构建了Intent3D数据集,包含44,990条意图文本,并提出IntentNet模型。实验结果表明,IntentNet在多个评估指标上显著优于现有方法,分别提高了11.22%至11.06%的Top1准确率和6.72%至9.12%的AP值。这一成果将有助于推动智能体、自动驾驶等领域的发展。
来源:https://mp.weixin.qq.com/s/DXExxwZ7t6lzdfoKa3kJYQ
页: [1]
查看完整版本: 3D意图定位助力智能交互