在城市环境中的开放词汇三维物体检测 原文约200字,阅读约需1分钟。发表于:2024-03-20T00:00:00Z。 通过开放式词汇学习、视觉语言模型和远程模拟器,我们解决了当前基于激光雷达的 3D 物体检测系统的局限性,实现了对新颖对象的高效检测和识别。 该文章介绍了一种预测开放词汇的方法,通过3D语义体素占用图实现对自由形式语言查询的定位、分割和检索。该方法包括新的模型架构、三模态自监督学习算法,并在几个开放词汇任务上展示了模型的优势。 3D语义体素占用图 开放词汇任务 模型架构 自监督学习算法 预测开放词汇