uAI Nexus MedVLM是全球首个开源医疗视频理解大模型,能够准确分析手术视频,显著提升手术安全性和效率。该模型的发布标志着医疗视频理解领域的重要突破,促进了全球开发者的合作与技术进步。
本研究提出了EgoSurgery-HTS数据集,解决了手术视频中缺乏像素级标注的问题。该数据集涵盖14种手术工具及手部标注,显著提高了手部和工具的分割精准度,推动了手术视频分析的发展。
本研究提出了一种数据中心方法,以提高荧光寿命成像(FLIm)在手术中的实时检测精度。通过实例分割模型,检测准确性和鲁棒性显著提升,手术视频中的中位检测率达到85%,增强了实时图像引导的可靠性。
该研究利用卷积神经网络分析手术视频,自动评估外科医生的技能,包括工具使用模式和运动经济性。通过深度学习方法,提出了多路径框架和时空神经网络,显著提高了手术技能评估和步骤识别的准确性,推动了微创手术的发展。
该研究利用卷积神经网络分析手术视频中的工具移动,自动评估外科医生的技能。文章探讨了基于视觉的手术工具分割和跟踪方法,强调深度学习在手术效率和数据科学中的应用潜力。通过无监督和自监督模型,显著降低了对人工标注的依赖,推动了手术图像分析的进展。
本文介绍了一种基于多尺度变换器的手术视频阶段识别方法,通过时空特征联合学习显著提高识别准确率。在Cholec80数据集上验证,该方法在线和离线识别准确率分别达到95.26%和96.15%。提出的自回归手术变压器(ARST)和STAR-Net模型在手术阶段识别中表现优异,展示了在医疗视频分析中的应用潜力。
该研究利用场景图和图卷积网络对手术视频进行建模,提升了自动化手术工作流识别的性能。引入新颖的图编辑模块和多模态数据,展示了在手术阶段识别和技能评估中的有效性,提供了可解释的结果,促进了手术教育和技能提升。
本文介绍了一种自监督手术视频去烟除雾方法(SelfSVD),有效解决了合成烟和密集烟雾处理问题。该方法通过二阶段网络重建清晰的手术场景,实验结果表明其在烟雾去除质量和计算效率上优于现有技术。
完成下面两步后,将自动完成登录并继续当前操作。