SDR-Former:一种用于肝脏病变分类的孪生双分辨率 Transformer,使用 3D 多相成像
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本研究介绍了一种名为S^2Former-OR的新型变压器框架,用于手术室中的场景图生成。该框架能够以端到端的方式利用多视角的2D场景和3D点云进行场景图生成。通过引入视图同步转运方案,促进多视角视觉信息交互,并设计几何视觉凝聚操作将2D语义特征与3D点云特征整合。实验证明,S^2Former-OR在4D手术室基准测试中具有卓越性能和较低计算成本。与当前的OR-SGG方法相比,提高了3%的精度并减少了24.2M的模型参数。
🎯
关键要点
- 本研究介绍了一种名为S^2Former-OR的新型变压器框架,用于手术室中的场景图生成。
- 该框架能够以端到端的方式利用多视角的2D场景和3D点云进行场景图生成。
- 引入视图同步转运方案,促进多视角视觉信息交互。
- 设计几何视觉凝聚操作,将2D语义特征与3D点云特征整合。
- 提出了一种新颖的关系敏感变压器解码器,实现无需中间步骤直接预测实体对关系的图生成。
- 实验证明,S^2Former-OR在4D手术室基准测试中具有卓越性能和较低计算成本。
- 与当前的OR-SGG方法相比,S^2Former-OR提高了3%的精度并减少了24.2M的模型参数。
- 方法与更广泛指标的通用单阶段SGG方法进行了全面评估,始终获得更好的性能。
- 代码将提供。
🏷️
标签
➡️