SDR-Former:一种用于肝脏病变分类的孪生双分辨率 Transformer,使用 3D 多相成像

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本研究介绍了一种名为S^2Former-OR的新型变压器框架,用于手术室中的场景图生成。该框架能够以端到端的方式利用多视角的2D场景和3D点云进行场景图生成。通过引入视图同步转运方案,促进多视角视觉信息交互,并设计几何视觉凝聚操作将2D语义特征与3D点云特征整合。实验证明,S^2Former-OR在4D手术室基准测试中具有卓越性能和较低计算成本。与当前的OR-SGG方法相比,提高了3%的精度并减少了24.2M的模型参数。

🎯

关键要点

  • 本研究介绍了一种名为S^2Former-OR的新型变压器框架,用于手术室中的场景图生成。
  • 该框架能够以端到端的方式利用多视角的2D场景和3D点云进行场景图生成。
  • 引入视图同步转运方案,促进多视角视觉信息交互。
  • 设计几何视觉凝聚操作,将2D语义特征与3D点云特征整合。
  • 提出了一种新颖的关系敏感变压器解码器,实现无需中间步骤直接预测实体对关系的图生成。
  • 实验证明,S^2Former-OR在4D手术室基准测试中具有卓越性能和较低计算成本。
  • 与当前的OR-SGG方法相比,S^2Former-OR提高了3%的精度并减少了24.2M的模型参数。
  • 方法与更广泛指标的通用单阶段SGG方法进行了全面评估,始终获得更好的性能。
  • 代码将提供。
➡️

继续阅读