晓飞的算法工程笔记 ·

LORS：腾讯提出低秩残差结构，瘦身模型不掉点 | CVPR 2024 - 晓飞的算法工程笔记

💡 原文中文，约6100字，阅读约需15分钟。

📝

内容提要

深度学习模型中的堆叠结构导致参数数量激增，影响应用。为解决此问题，提出低秩残差结构（LORS），允许模块共享大部分参数，仅需少量独特参数。实验表明，LORS可减少解码器70%的参数，同时保持或提升性能。

🎯

❓

低秩残差结构（LORS）是一种允许深度学习模型中的模块共享大部分参数，仅需少量独特参数的结构，旨在减少模型参数数量。

LORS通过将堆叠模块的参数分解为共享参数和私有参数，允许模块共享大部分参数，从而减少总体参数使用。

实验表明，LORS能够在AdaMixer解码器中成功减少高达70%的参数，同时保持或提升模型性能。

与知识蒸馏、剪枝和量化等方法不同，LORS通过共享参数来减少参数数量，而不影响模型的表达能力。

LORS适用于需要堆叠结构的深度学习模型，如Transformers和ResNet等，尤其是在计算机视觉和自然语言处理领域。

LORS的核心贡献在于通过引入低秩参数矩阵，显著减少需要微调的参数量，从而降低计算成本和内存需求。

🏷️