本文提出了一种基于一致性约束的得分匹配方法,显著提升了CIFAR-10、AFHQ和FFHQ数据集的生成效果。研究利用潜在一致性模型解决高分辨率图像合成中的计算负担,提出了Stochastic Consistency Distillation方法,加快文本到图像生成过程,减少训练时间并提高生成图像质量,最终在多个数据集上实现了优于现有模型的效果。
本文介绍了一种基于学习的图像去雾域适应模型,该模型结合了图像翻译和去雾模块,通过一致性约束进行训练,以提升去雾效果。实验结果表明,该模型在合成和真实图像中均表现优异。此外,文中还探讨了多种基于CLIP的视觉-语言模型改进方法,显著提升了图像分类、短语定位和视线估计等任务的性能。
本文提出了一种基于弱监督学习的单目3D物体检测方法,使用2D标签进行模型训练,并探索了投影、多视图和方向这三种一致性约束以及新的2D方向标记方法。实验证明,该方法在一些完全监督方法上具有可比性能,并且预训练时仅使用1/3的3D标签就能优于完全监督基线。
该研究提出了一种新的详细重建方法,通过两阶段训练过程、解耦视角相关与视角无关颜色、借助两个新的一致性约束来提高性能,并引入关键的掩码方案以自适应地影响监督约束的选择。实验证明了该方法在合成和真实世界数据集上的能力,降低先验估计错误干扰,实现高质量场景重建,并保留了丰富的几何细节。
完成下面两步后,将自动完成登录并继续当前操作。