本文介绍了全面和多粒度的前列腺切除手术场景理解(GraSP)数据集和引入的TAPIS模型。TAPIS模型相对于以前的基线和传统模型更优越,并验证了数据集的可靠性和适用性。这项工作在内窥镜视觉领域迈出了重要的一步。
本文介绍了前列腺切除手术场景理解数据集及其多粒度任务层次结构,包括手术阶段和步骤识别等长期任务,以及手术器械分割和原子视觉动作检测等短期任务。通过TAPIS模型验证了其在短期识别任务中的优越性,同时验证了方法的鲁棒性和数据集的可靠性。该工作为内窥镜视觉领域提供了一个新颖且全面的框架。
完成下面两步后,将自动完成登录并继续当前操作。