SGIFormer:用于三维实例分割的语义引导和几何增强交叉 Transformer
原文中文,约400字,阅读约需1分钟。发表于: 。提出了一种名为 SGIFormer 的新方法,用于 3D 实例分割,它由 Semantic-guided Mix Query(SMQ)初始化和 Geometric-enhanced Interleaving Transformer(GIT)解码器组成,通过利用预测的体素级语义信息隐含生成场景感知查询,我们的 GIT 解码器对实例查询和全局场景特征进行交替精化,以进一步捕获细粒度信息和减少设计复杂性。
介绍了一种名为S^2Former-OR的新型变压器框架,用于手术室中的场景图生成,通过多视角的2D场景和3D点云生成场景图,具有较低的计算成本,提高了精度并减少了模型参数。