小红花·文摘

本研究提出EndoVLA模型，旨在解决传统内窥镜操作中对异常区域追踪能力不足和手动调优负担重的问题。该模型结合内窥镜图像与医生提示，整合视觉、语言和运动规划，采用双阶段策略，显著提升追踪性能和零样本泛化能力。

EndoVLA: A Dual-Phase Vision-Language-Action Model for Autonomous Tracking in Endoscopy

BriefGPT - AI 论文速递 ·

该研究解决了在内窥镜视频中进行组织点跟踪的挑战，尤其是应对复杂变形、工具遮挡和稀缺标注的问题。我们提出的Endo-TTAP框架通过多面引导注意力模块和两阶段课程学习策略，提高了长期跟踪的准确性，尤其在复杂的内窥镜条件下表现出色。

Endo-TTAP：通过多面引导注意力和混合流点监督实现稳健的内窥镜组织跟踪

BriefGPT - AI 论文速递 ·

本研究提出了Endo3DAC框架，旨在提高内窥镜三维场景重建中的自监督学习效率。通过冻结基础模型并训练新设计的GDV-LoRA，显著提升了深度和姿态估计的准确性，同时保持训练效率。

Learning to Efficiently Adapt Foundation Models for Self-Supervised Endoscopic 3D Scene Reconstruction

BriefGPT - AI 论文速递 ·

人工智能系统采用双分支架构为内窥镜图像添加深度感知

DEV Community ·

本研究提出了一种新颖的多模态视觉特征学习框架，有效解决了内窥镜实时自我运动追踪的挑战，实验结果表明其性能优于现有技术，推理速度超过每秒30帧。

REMOTE: Real-time Ego-motion Tracking of Various Endoscopes via Multimodal Visual Feature Learning

BriefGPT - AI 论文速递 ·

本研究解决了消化系统疾病的重要指标——胃肠道出血的高效准确检测问题。我们提出了一种统一的YOLOv8-X模型，能够同时检测和分类无线胶囊内窥镜图像中的出血区域，并在验证数据集上实现了96.10%的分类准确率和76.8%的平均精度。这一工作为提高出血检测的效果及相关临床应用提供了显著帮助。

基于YOLOv8-X的无线胶囊内窥镜自动出血检测与分类

BriefGPT - AI 论文速递 ·

本研究提出了一种自监督框架，旨在解决复杂胃肠道条件下内窥镜的深度与姿态估计问题。实验结果表明，该方法在准确性和真实感方面显著优于现有技术，具有重要的临床应用潜力。

Application of Self-Supervised Monocular Depth and Pose Estimation Based on Generative Latent Priors in Endoscopy

BriefGPT - AI 论文速递 ·

本研究提出了PR-ENDO框架，利用3D高斯散点和物理基础的可重照明模型，解决内窥镜程序中的三维重建挑战，显著提高了图像质量，具有重要的临床应用潜力。

PR-ENDO: Application of a Physically Based Relightable Gaussian Splatting Model in Endoscopy

BriefGPT - AI 论文速递 ·

全球肠胃病患者已达1.2亿，胶囊内窥镜（MCCE）因其无痛、非侵入性而备受关注。华中科技大学团队提出的自监督S2P-Matching方法显著提升了图像拼接的准确性，助力早期肠胃疾病的诊断。该研究已在IEEE期刊上发表，推动了无创内镜技术的应用。

匹配正确率提升187.9%！华中科技大学CGCL实验室用自监督学习助力胶囊内窥镜图像拼接，「天眼」里也可看肠胃健康

HyperAI超神经 ·

本研究解决了胶囊内窥镜视频帧中肠胃异常自动分类的有效性问题。通过将全维度门控注意力机制与小波变换技术相结合，模型能够聚焦于内窥镜图像中最关键的区域，提高对微妙特征的检测能力。该模型在不平衡的数据集上取得了92.76%的训练精度和94.81%的平衡精度，显示出显著的分类准确性和临床应用潜力。

基于门控注意力和小波变换的胶囊内窥镜多分类研究

BriefGPT - AI 论文速递 ·

本文探讨了利用深度学习改善胃肠道癌症诊断的框架，提出了多种算法和模型，包括基于混合卷积神经网络的异常检测和结合CNN与Transformer的混合模型，这些方法在多个数据集上取得了高准确率。此外，研究介绍了GastroVision数据集，以促进AI在胃肠疾病检测中的应用。

将深度特征提取与混合ResNet-DenseNet模型结合用于内窥镜图像中的多类异常检测

BriefGPT - AI 论文速递 ·

本研究针对内窥镜深度估计中的参数适应不足问题，提出了一种全参数与高效参数的学习框架。该框架能够适应多种子空间，显著提升性能，初步实验表明在SCARED数据集上的性能提升达到10.2%至4.1%。

Towards Full-parameter and Parameter-efficient Self-learning for Endoscopic Camera Depth Estimation

BriefGPT - AI 论文速递 ·

本文研究图像目标导航，提出了一种基于拓扑表示法和深度学习的解决方案，显著提升了长时间任务的性能。开发的SLAM系统在内窥镜图像重建中表现优异，ColonFormer网络架构能够精确分割息肉。此外，研究提出结合合成与真实数据的新方法，提升深度图预测的准确性，推动内窥镜自动导航的发展。

利用深度特征和拓扑先验的结肠镜拓扑SLAM

BriefGPT - AI 论文速递 ·

本文介绍了一种无监督自我监督方法，用于从单目内窥镜数据中估计深度，克服了传统方法的局限性。研究提出了Endo-4DGS和EndoOmni等创新技术，显著提高了深度估计的准确性和效率，具有重要的临床应用潜力。

推进深度任何模型以无监督的单目深度估计在内窥镜中的应用

BriefGPT - AI 论文速递 ·

本研究提出了EndoOmni，用于内窥镜零样本跨域深度估计的基础模型。通过改进的自学习框架，结合深度标签和信心估计，提高了医疗成像的相对深度估计准确性，相对误差减少了41%。

EndoOmni：通过噪声标签的强鲁棒自学习实现内窥镜的零样本跨数据集深度估计

BriefGPT - AI 论文速递 ·

本文介绍了多种基于神经辐射场（NeRF）的方法，如S-NeRF、MVG-NeRF和贝叶斯NeRF，旨在提高三维重建的准确性和不确定性量化。这些方法结合深度信息、法线和贝叶斯学习框架，优化了场景预测和视角合成，展示了在动态环境和稀疏视图设置中的有效性。

UC-NeRF：基于内窥镜稀疏视图的关注不确定性的条件神经辐射场

BriefGPT - AI 论文速递 ·

本研究解决了机器人辅助手术中的深度估计不足问题，提出了一种新的适应技术——矢量低秩适应（Vector-LoRA），用于在手术场景中进行自我监督的单目深度估计。研究结果表明，该方法相较于现有技术在绝对相对误差指标上提高了13.3%，显著增强了手术环境中的深度感知能力。

DARES：通过自我监督的基础模型的矢量低秩适应来进行机器人内窥镜手术的深度估计

BriefGPT - AI 论文速递 ·

本文介绍了基于级联视频扩散模型的Imagen Video系统，该系统能够生成高质量的医学视频和图像，特别适用于内窥镜和机器人辅助手术。研究提出的SurgicaL-CD方法利用一致性蒸馏扩散技术，在无配对数据的情况下生成逼真的手术图像，解决了医学领域标注数据稀缺的问题，为计算机辅助外科系统的开发提供了新思路。

SurGen：用于外科手术视频生成的文本引导扩散模型

BriefGPT - AI 论文速递 ·

本文提出了一种基于混合卷积神经网络的异常检测算法，分类精度达到97%和98%。研究还介绍了无线胶囊内窥镜图像处理的新方法，结合多尺度卷积神经网络和主动学习策略，显著提高了诊断准确性和临床应用潜力。

WCEbleedGen：用于自动出血分类、检测和分割的无线胶囊内窥镜数据集及其基准测试

BriefGPT - AI 论文速递 ·

本文探讨了深度学习在胃肠道内窥镜图像分析中的应用，提出了多种模型和算法以提高识别率和准确性。研究表明，卷积神经网络和视觉转换器在特征提取和分类方面表现优越，尤其在资源有限的环境中开发轻量级模型具有重要意义。此外，GastroVision数据集的推出为胃肠疾病检测提供了丰富的标注数据，促进了相关算法的发展。

基于CNN-Transformer模型的内窥镜和视频胶囊图像分类

BriefGPT - AI 论文速递 ·