3D意图定位助力智能交互
一项新研究引入了3D意图定位任务,旨在通过自然语言指令在3D场景中检测目标物体。与传统3D视觉定位不同,该方法基于用户意图自动推理目标,无需明确描述。研究人员构建了Intent3D数据集,包含44,990条意图文本,并提出IntentNet模型。实验结果表明,IntentNet在多个评估指标上显著优于现有方法,分别提高了11.22%至11.06%的Top1准确率和6.72%至9.12%的AP值。这一成果将有助于推动智能体、自动驾驶等领域的发展。来源:https://mp.weixin.qq.com/s/DXExxwZ7t6lzdfoKa3kJYQ
页:
[1]