保持结构的图像翻译用于结肠镜视频中的深度估计
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了结肠镜视频中单目深度估计面临的合成数据与实际临床数据之间的域差距问题。提出了一种结构保持的合成到真实图像翻译通用流程,以生成大量逼真的合成图像,从而提高深度估计的泛化能力。研究结果表明,翻译后的图像在保持深度几何特征的同时具有较高的真实性,有助于下游深度估计任务表现的提升。
本研究解决了结肠镜视频中单目深度估计面临的合成数据与实际临床数据之间的域差距问题,并提出了一种结构保持的合成到真实图像翻译通用流程,以提高深度估计的泛化能力。研究结果表明,翻译后的图像在保持深度几何特征的同时具有较高的真实性,有助于提升下游深度估计任务的表现。