本文介绍了GraSP数据集,专注于前列腺切除手术的多层次理解。通过TAPIS模型结合视频特征和器械分割,实现手术阶段和步骤识别。实验验证了TAPIS在短期任务中的优越性,证明了数据集的可靠性,为内窥镜视觉领域提供了新框架。
本文介绍了全面和多粒度的前列腺切除手术场景理解(GraSP)数据集和引入的TAPIS模型。TAPIS模型相对于以前的基线和传统模型更优越,并验证了数据集的可靠性和适用性。这项工作在内窥镜视觉领域迈出了重要的一步。
完成下面两步后,将自动完成登录并继续当前操作。