DenseDINO是一种自监督学习框架,用于学习密集视觉表示。它通过引入基于token的点级监督,利用了空间信息。在ImageNet分类评估中表现有竞争力,在PascalVOC语义分割中实现了大幅度提升。
SherlockNet是一个自监督学习框架,用于验证杂乱手写数据中的个体身份。该方法经过大量实验验证,展示了在防欺诈和保护文化遗产等领域的应用潜力。
本研究提出了一种自监督学习框架,通过训练适配器将不同视角的特征映射到统一空间,解决交叉视图地理定位挑战。实验证明该方法在减少参数和仅使用无标签数据的情况下,相较于标准模型和有监督方法,性能有显著改进,并具有广泛应用潜力。
本文提出了一种自监督学习框架,用于从视频中估算对象的运动和深度,并建模为六个自由度刚体变换。该方法使用实例分割掩码引入对象信息,并通过引入几何约束损失项消除运动预测的尺度歧义。实验结果表明,该框架在处理数据时不需要外部注释,并能够捕捉对象的运动。与自监督研究方法相比,在3D场景流预测和动态区域的视差预测方面表现更好。
本研究提出了一种自监督学习框架,通过训练适配器将不同视角的特征映射到统一空间,解决交叉视图地理定位挑战。方法在减少参数和仅依靠无标签数据的情况下,相较于标准模型和有监督方法,性能显著改进,具有广泛应用潜力。
该研究介绍了双拉格朗日学习 (DLL) 方法,结合锥对偶理论和机器学习模型的表示能力。DLL 利用锥对偶性提供对偶可行解,为参数优化问题提供有效的拉格朗日对偶界限。论文介绍了可微锥投影层、对偶完成过程和自监督学习框架。DLL 在线性和非线性参数优化问题上表现出色,与最优解相差不超过0.5%。
本论文介绍了NCLR自监督学习框架,用于增强自动驾驶中的3D感知。通过学习可训练的转换对齐,实现了图像和点云的整体级别对齐。证明了NCLR在下游任务中的有效性,并联合学习不同模态提高了网络的理解能力和学习表示的有效性。
完成下面两步后,将自动完成登录并继续当前操作。