本文提出了一种基于提示学习的无监督领域自适应方法DoPrompt,通过嵌入源域知识来改善目标域的预测。实验结果显示,该方法在多个基准数据集上显著提高了模型精度,有效解决了领域泛化问题,并减少了源域与目标域之间的分布差异。
本文介绍了一种新的半监督语义分割视角,通过提高无标记数据的不确定性来减小分布差异,提高模型的推广能力。作者提出了两种策略,并设计了一种特别针对半监督语义分割的不确定性增强算法,实验证实了算法和策略的有效性。该方法在常用基准数据集上取得了最新性能。
该文介绍了一种名为“Synthesis Step by Step (S3)”的数据合成框架,通过使用大型语言模型对小型真实验证数据集上的小型模型合成数据集中的错误进行外推,从而缩小合成数据集与真实数据之间的分布差异。实验表明,该方法能够提高小型模型的性能,相较于其他方法改进了9.48%和2.73%,并且相较于人工标注数据训练的小型模型最多提高了15.17%。
本文介绍了一种评估分布差异的方法——R-散度,并探讨了其在无监督和有监督任务中的测试能力。研究发现,R-散度实现了最先进的性能,并在带有噪声标签的样本上训练了鲁棒性神经网络。
本文研究了在ε污染下对最大均值差异(MMD)的估计,并提出了一种估计MMD界的方法。通过实验证明,该方法优于其他替代方法。
本文介绍了一种名为OOD-GMixup的方法,用于解决图分类问题中的分布差异。该方法通过调控度量空间中的训练分布,并通过消除杂乱相关和生成虚拟样本来度量和控制分布偏差。实验证明,该方法在几个真实世界的图分类数据集上优于现有方法。
完成下面两步后,将自动完成登录并继续当前操作。