本研究提出EndoVLA模型,旨在解决传统内窥镜操作中对异常区域追踪能力不足和手动调优负担重的问题。该模型结合内窥镜图像与医生提示,整合视觉、语言和运动规划,采用双阶段策略,显著提升追踪性能和零样本泛化能力。
该研究解决了在内窥镜视频中进行组织点跟踪的挑战,尤其是应对复杂变形、工具遮挡和稀缺标注的问题。我们提出的Endo-TTAP框架通过多面引导注意力模块和两阶段课程学习策略,提高了长期跟踪的准确性,尤其在复杂的内窥镜条件下表现出色。
本研究提出了Endo3DAC框架,旨在提高内窥镜三维场景重建中的自监督学习效率。通过冻结基础模型并训练新设计的GDV-LoRA,显著提升了深度和姿态估计的准确性,同时保持训练效率。
该研究提出了一种新颖的双分支架构MetaFE-DE,用于内窥镜图像的深度估计。该方法结合全局和局部特征提取,在深度估计基准测试中表现优异,帮助外科医生更好地理解手术中的三维结构。
本研究提出了一种新颖的多模态视觉特征学习框架,有效解决了内窥镜实时自我运动追踪的挑战,实验结果表明其性能优于现有技术,推理速度超过每秒30帧。
本研究解决了消化系统疾病的重要指标——胃肠道出血的高效准确检测问题。我们提出了一种统一的YOLOv8-X模型,能够同时检测和分类无线胶囊内窥镜图像中的出血区域,并在验证数据集上实现了96.10%的分类准确率和76.8%的平均精度。这一工作为提高出血检测的效果及相关临床应用提供了显著帮助。
本研究提出了一种自监督框架,旨在解决复杂胃肠道条件下内窥镜的深度与姿态估计问题。实验结果表明,该方法在准确性和真实感方面显著优于现有技术,具有重要的临床应用潜力。
本研究提出了PR-ENDO框架,利用3D高斯散点和物理基础的可重照明模型,解决内窥镜程序中的三维重建挑战,显著提高了图像质量,具有重要的临床应用潜力。
全球肠胃病患者已达1.2亿,胶囊内窥镜(MCCE)因其无痛、非侵入性而备受关注。华中科技大学团队提出的自监督S2P-Matching方法显著提升了图像拼接的准确性,助力早期肠胃疾病的诊断。该研究已在IEEE期刊上发表,推动了无创内镜技术的应用。
本研究解决了胶囊内窥镜视频帧中肠胃异常自动分类的有效性问题。通过将全维度门控注意力机制与小波变换技术相结合,模型能够聚焦于内窥镜图像中最关键的区域,提高对微妙特征的检测能力。该模型在不平衡的数据集上取得了92.76%的训练精度和94.81%的平衡精度,显示出显著的分类准确性和临床应用潜力。
内窥镜在胃肠道异常识别中至关重要。本文提出一种轻量级深度学习模型,结合知识蒸馏和多头注意力机制,适用于资源有限的环境。通过KVASIR-V2和Hyper-KVASIR数据集验证,表现出良好性能。
本研究提出了一种新的学习框架,解决了内窥镜深度估计中参数适应性不足的问题。该框架能适应多种子空间,显著提升性能。在SCARED数据集上的实验中,性能提升了4.1%到10.2%。
本研究提出了一种创新的轻量级解决方案,通过整合卷积神经网络和Transformer来预测多尺度深度图。方法包括优化网络架构、引入多尺度膨胀卷积和多通道注意机制。研究旨在提高腹腔镜手术的效率和安全性。经评估结果表明,该方法在保持轻量级的同时确保了深度估计的准确性。
本研究提出了EndoOmni,用于内窥镜零样本跨域深度估计的基础模型。通过改进的自学习框架,结合深度标签和信心估计,提高了医疗成像的相对深度估计准确性,相对误差减少了41%。
贝叶斯神经辐射场(NeRF)能够准确量化不确定性,无需额外网络,适用于挑战性观测和无控制图像。通过扩展NeRF,处理RGB和深度的不确定性,并在全面数据集上提升性能。
本研究解决了机器人辅助手术中的深度估计不足问题,提出了一种新的适应技术——矢量低秩适应(Vector-LoRA),用于在手术场景中进行自我监督的单目深度估计。研究结果表明,该方法相较于现有技术在绝对相对误差指标上提高了13.3%,显著增强了手术环境中的深度感知能力。
无线胶囊内窥镜(WCE)是一种无创诊断方法,基于深度学习的EndoOOD框架能够提高WCE诊断能力的稳健性和可靠性,提高诊断准确性和支持临床决策。
内窥镜在胃肠道异常识别中起重要作用。深度学习特别是卷积神经网络在胃肠道内窥镜图像分析方面有优势。研究提出了基于多头注意力的特征融合机制,改进了轻量级模型。实验结果表明该模型在资源有限环境中运行的优点。
本研究提出了一种新的增强规模感知框架,解决了内窥镜导航中无法学习绝对尺度的问题。该方法在单目内窥镜场景中准确估计规模感知深度,具有临床应用潜力。
该文章介绍了一种创新的实时内窥镜动态重建方法,可以提高微创手术的效果。该方法使用了4D高斯飞溅和无需地面真实深度数据,并通过引入时间组件和轻量级MLP捕捉时间高斯变形,实现了具有可变条件的动态手术场景的重建。同时,该方法还整合了Depth-Anything,从单目视图中生成伪深度图,增强了深度引导重建过程。该方法在两个手术数据集上通过验证,证明了实时渲染、高效计算和重建准确性,具有改善手术辅助的巨大潜力。
完成下面两步后,将自动完成登录并继续当前操作。