低参数图像到手术视频迁移学习的手术阶段识别
原文中文,约300字,阅读约需1分钟。发表于: 。该研究解决了在医学领域中,利用图像预训练模型进行手术视频阶段识别时面临的数据稀缺和空间-时间建模不足的问题。文中提出了一种新的参数高效迭代学习方法SurgPETL,通过引入空间-时间适应模块,显著提高了手术阶段识别的准确性和可靠性。研究结果表明,SurgPETL在多个手术程序的挑战性数据集上表现出了优越的效果。
本文介绍了多尺度动作分割变换器(MS-AST)和因果变换器(MS-ASCT),用于识别手术阶段。这些技术结合空间和时间信息,在不同尺度上建模,在 Cholec80 数据集上分别实现了95.26%和96.15%的准确率,并在非医学视频中也表现出色。