学习高效适应基础模型进行自监督内窥镜三维场景重建
本研究针对内窥镜深度估计和三维场景重建中的自监督学习(SSL)方法,提出了Endo3DAC框架,填补了在医疗领域对基础模型适应策略的探索空白。通过冻结基础模型并仅训练新设计的Gated Dynamic Vector-Based Low-Rank Adaptation (GDV-LoRA),本框架在深度和姿态估计上取得了显著提升,同时保持了训练效率。
本研究提出了Endo3DAC框架,针对内窥镜深度估计和三维场景重建中的自监督学习,填补了医疗领域基础模型适应策略的空白。通过冻结基础模型并训练新设计的GDV-LoRA,显著提升了深度和姿态估计的效果。