SANGRIA:用于手术工作流预测的手术视频场景图优化
原文中文,约500字,阅读约需2分钟。发表于: 。基于图形的整体场景表示在外科手术工作流程理解方面发挥着重要作用,本研究提出了一种端到端的框架,用于生成和优化外科手术场景图以及下游任务中的空间时间关系和节点特征,并仅使用弱手术阶段标签解决了外科视频中的语义场景理解和场景图生成任务。
本文介绍了前列腺切除手术场景理解数据集及其多粒度任务层次结构,包括手术阶段和步骤识别等长期任务,以及手术器械分割和原子视觉动作检测等短期任务。通过TAPIS模型验证了其在短期识别任务中的优越性,同时验证了方法的鲁棒性和数据集的可靠性。该工作为内窥镜视觉领域提供了一个新颖且全面的框架。