量子位 ·

CVPR满分论文：一块2080Ti搞定数据蒸馏，GPU占用仅2G，来自上交大“最年轻博导”课题组

💡 原文中文，约3000字，阅读约需8分钟。

📝

内容提要

上交大EPIC实验室提出的新数据蒸馏方法NFCM，使用2080Ti显卡仅需2GB内存，显著提升性能和速度。该方法将数据蒸馏转化为minmax优化问题，优化合成数据质量，适用于多个基准数据集，表现优异。

🎯

🔎

NFCM方法通过将数据蒸馏转化为minmax优化问题，显著提升了合成数据的质量和速度。这种创新性不仅提高了性能，还降低了对计算资源的需求，使得在较低配置的GPU上也能实现高效的数据处理。

NFCM在多个基准数据集上表现优异，尤其在CIFAR系列数据集上实现了无损蒸馏。这表明该方法在实际应用中具有广泛的潜力，尤其是在需要高效数据处理的深度学习任务中，能够有效提升模型的训练效率和准确性。

NFCM在CIFAR-100数据集上的训练时间比TESLA快29.4倍，内存消耗仅为其1/23.3。这种资源节约使得研究人员和开发者能够在有限的硬件条件下进行更复杂的实验，降低了技术门槛。

❓

NFCM方法显存占用仅为1/300，速度提升20倍，且在多个数据集上表现优异。

NFCM将数据蒸馏转化为minmax优化问题，通过交替优化合成数据和分布差异度量来提升数据质量。

在CIFAR数据集上，NFCM实现了无损数据集蒸馏，测试精度超过所有基线方法。

NFCM引入了神经特征函数差异（NCFD）作为新的分布差异度量，综合考虑所有采样频率上的CF差异。

在CIFAR-100上，NFCM每轮迭代训练时间比TESLA快29.4倍，内存消耗仅为TESLA的1/23.3。

研究团队包括第一作者王少博和通讯作者张林峰，张林峰年仅27岁，是上交大最年轻博导。

🏷️