选择性推动生产力:提高迁移学习效率的高效数据集修剪

💡 原文中文,约500字,阅读约需1分钟。
📝

内容提要

本文提出了两种新的数据集剪枝方法,可以在不牺牲下游性能的情况下,将源数据类别剪枝达到40%至80%,在预训练阶段实现了显著的2至5倍加速。该方法具有广泛的适用性,可以改进其他计算密集型的传输学习技术。

🎯

关键要点

  • 提出了两种新的数据集剪枝方法,标签映射和特征映射。
  • 旨在通过识别和删除冗余训练样本,提高预训练效率。
  • 现有的数据集剪枝方法不适用于传输学习范式。
  • 源数据类别可以剪枝达到40%至80%,而不牺牲下游性能。
  • 在预训练阶段实现了显著的2至5倍加速。
  • 方法具有广泛的适用性,可以改进其他计算密集型的传输学习技术。
➡️

继续阅读