面向泌尿外科手术机器人的零样本视觉去雾
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
本文介绍了GraSP数据集,专注于前列腺切除手术的多层次理解。通过TAPIS模型结合视频特征和器械分割,实现手术阶段和步骤识别。实验验证了TAPIS在短期任务中的优越性,证明了数据集的可靠性,为内窥镜视觉领域提供了新框架。
🎯
关键要点
- 本文介绍了GraSP数据集,专注于前列腺切除手术的多层次理解。
- 手术场景理解被建模为具有不同粒度的互补任务的层次结构。
- 方法包括手术阶段和步骤识别等长期任务,以及器械分割和原子视觉动作检测等短期任务。
- 引入了TAPIS模型,结合全局视频特征提取器和局部区域提议。
- 实验验证了TAPIS在短期任务中的优越性,突出了不同任务的粒度要求。
- 通过多个公共基准验证了方法的鲁棒性,确认了数据集的可靠性和适用性。
- 这项工作为内窥镜视觉领域提供了新框架,推动了手术程序的全面理解。
➡️