通过联合示例选择进一步加速多模态学习

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

我们提出了一种在线数据选择策略来加速大规模预训练,减少模型性能所需的计算量并提高效率。在训练视觉分类器和多模态模型时,我们的方法分别减少了46%和51%的训练更新次数和25%的总计算量。在大规模图像-文本数据集上实现了新的最优效果。

🎯

关键要点

  • 提出了一种在线数据选择策略以加速大规模预训练。

  • 基于模型的数据选择可以减少达到均匀采样训练的模型性能所需的总计算量。

  • 小型模型能够有效代表大型模型的损失,从而降低评分数据的计算量。

  • 数据选择策略具有普适性,适用于不同的数据集和任务。

  • 方法 ClassAct 和 ActiveCLIP 在训练视觉分类器和多模态模型时,分别减少了46%和51%的训练更新次数。

  • 总计算量减少了25%。

  • 该方法在大规模图像-文本数据集上实现了新的最优效果。

➡️

继续阅读