EndoDAC: 适用于任何内视镜摄像机的高效自我监督深度估计的适应性基础模型
原文中文,约400字,阅读约需1分钟。发表于: 。我们提出了一种高效的自监督深度估计框架 EndoDAC,它通过采用动态向量化低秩适应方法(DV-LoRA)和卷积颈块,利用极少的可训练参数将基础模型适应于外科手术领域,从而在更少的训练时期和未了解相机内参数的情况下获得卓越的性能。
本研究提出了一种创新的轻量级解决方案,通过整合卷积神经网络和Transformer来预测多尺度深度图,以提高腹腔镜手术的效率和安全性。方法包括优化网络架构、引入多尺度膨胀卷积和多通道注意机制。经评估结果表明,该方法在保持轻量级的同时确保了深度估计的准确性。