机器之心 ·

ICLR 2025 | 四川大学提出Test-time Adaptation新范式，突破查询偏移挑战

💡 原文中文，约6000字，阅读约需15分钟。

📝

内容提要

在 NeurIPS 2024 大会上，OpenAI 的 Ilya Sutskever 提出了 Test-time Adaptation（TTA）以解决推理阶段的查询偏移问题。四川大学的 XLearning 团队将 TTA 应用于跨模态检索，提升了模型的鲁棒性。该研究已被 ICLR 2025 接收，推动了基础模型的推理自适应发展。

🎯

关键要点

在 NeurIPS 2024 大会上，OpenAI 的 Ilya Sutskever 提出了 Test-time Adaptation（TTA）以解决推理阶段的查询偏移问题。
四川大学的 XLearning 团队将 TTA 应用于跨模态检索，提升了模型的鲁棒性。
该研究已被 ICLR 2025 接收，推动了基础模型的推理自适应发展。
TTA 旨在使预训练模型动态适应推理阶段中不同分布类型的数据，提高分布外泛化能力。
当前 TTA 的应用主要集中在单模态任务中，存在局限性。
XLearning 团队的研究有效缓解了查询偏移挑战，推动了跨模态应用的发展。
查询偏移会降低模态内的均匀性和增大模态间的差异，导致模型性能下降。
本文提出的 TCR 通过调整模态内分布和模态间差异，实现鲁棒的跨模态检索。
TCR 建立了统一的基准，涵盖多个数据集和模态损坏场景。
本文提出的噪声鲁棒学习方法通过自适应阈值过滤高熵预测，提升模型稳定性。
未来，TTA 有望在更复杂的跨模态场景中发挥关键作用，推动基础模型的推理自适应发展。

🔎

延伸解读

查询偏移的影响

查询偏移会导致模型在推理阶段的性能下降，主要体现在模态内均匀性降低和模态间差异增大。这种现象使得模型难以处理多样化的查询，影响跨模态检索的效果。因此，理解查询偏移的根本原因对于提升模型的鲁棒性至关重要。

TTA的局限性与扩展

尽管Test-time Adaptation（TTA）在单模态任务中表现良好，但其在跨模态检索中的应用仍面临挑战。四川大学的研究通过将TTA扩展至跨模态检索，提供了新的解决方案，显示出在复杂场景中提升模型适应性的潜力。

噪声鲁棒学习的重要性

在跨模态检索中，查询偏移可能导致高噪声现象，影响模型的稳定性。本文提出的噪声鲁棒学习方法，通过自适应阈值过滤高熵预测，能够有效提升模型对噪声的抵抗力，从而增强检索性能。

❓

延伸问答

什么是Test-time Adaptation（TTA）？

Test-time Adaptation（TTA）是一种使预训练模型动态适应推理阶段不同数据分布的技术，旨在提高模型的分布外泛化能力。

四川大学的XLearning团队在TTA方面做了什么创新？

四川大学的XLearning团队将TTA应用于跨模态检索，有效缓解了查询偏移挑战，推动了跨模态应用的发展。

查询偏移对模型性能有什么影响？

查询偏移会降低模态内的均匀性并增大模态间的差异，导致模型在推理阶段的性能下降。

TCR方法是如何解决查询偏移问题的？

TCR通过调整模态内分布和模态间差异，缓解查询偏移带来的负面影响，实现鲁棒的跨模态检索。

TTA在未来的应用前景如何？

未来，TTA有望在更复杂的跨模态场景中发挥关键作用，推动基础模型的推理自适应发展。

ICLR 2025会议上关于TTA的研究有什么重要性？

该研究被ICLR 2025接收并评选为Spotlight，显示了其在推动基础模型推理自适应发展方面的重要性。

🏷️