ODIN:一个用于 2D 和 3D 感知的单一模型
原文中文,约200字,阅读约需1分钟。发表于: 。ODIN 是一种利用转换器架构,在 2D RGB 图像和 3D 点云上进行分割和标记的模型,通过位置编码区分 2D 和 3D 特征操作,在多个基准测试上实现了最先进的性能。
OneFormer3D是一种能够同时处理实例分割和语义分割的模型,通过统一的实例和语义查询进行训练。该模型在ScanNet测试排行榜中获得第一名和最佳性能,并在ScanNet、ScanNet200和S3DIS数据集上展示了领先的分割结果。