机器之心 ·

ICML 2024 | 梯度检查点太慢？不降速、省显存，LowMemoryBP大幅提升反向传播显存效率

💡 原文中文，约4200字，阅读约需10分钟。

📝

内容提要

南开大学研究团队提出了两种反向传播改进策略，Approx-BP和MS-BP，旨在降低Transformer模型微调时的显存占用。实验表明，这些方法能有效减少20%至30%的显存，同时保持训练速度和效果不变，为优化神经网络的显存使用提供了新思路。

🎯

❓

LowMemoryBP方法旨在降低Transformer模型微调时的显存占用，同时保持训练速度和效果不变。

Approx-BP通过分段线性函数逼近激活函数来减少显存占用，MS-BP则通过共享激活张量来降低冗余。

使用LowMemoryBP方法可以将Transformer模型的显存占用降低20%至30%。

LowMemoryBP方法不会影响训练速度，保持了训练吞吐量。

Approx-BP理论突破了传统神经网络的优化框架，为使用非配对导数提供了理论可行性。

实验结果表明，LowMemoryBP方法在多个模型微调中显著降低了显存占用，同时没有损失训练效果。

🏷️

论独立游戏的起步立项方法论
在当下这个互联网时代做独立游戏，是幸运的，得益于各路大佬的经验分享，诸如引擎选择、外包渠道、素材获取，编程整合 […]
技嘉在COMPUTEX 2026展示多款生活美学主机
(全球TMT2026年6月5日讯)技嘉科技于COMPUTEX 2026展示多款生活美学主机，包含展现简约风格的 […]
技嘉于COMPUTEX 2026以“ENTER INFINITY”为主题开展
(全球TMT2026年6月5日讯)技嘉科技正式于COMPUTEX 2026以“ENTER INFINITY”为 […]
华为云发布Agentic AI系列新品打造智能时代“硅基黑土地”
华为云在上海INSPIRE大会上发布了Agentic Infra新范式及多款Agentic AI产品，旨在推动企业智能化转型。大会还推出“行业AI梦工厂”...
史上最强游戏掌机来了！性能堪比 PS5，但……
今年掌机市场因元器件成本上涨而涨价，但英特尔等公司推出的新芯片提升了掌机性能和能效。微星和宏碁的新款掌机搭载英特尔 Arc G3 处理器，表现出色，续航能...
国星宇航与腾讯云签署“星算”计划战略合作协议，携手领航AI云服务新生态
成都国星宇航与腾讯云签署战略合作协议，聚焦“星算”AI云服务，推动技术共创与生态建设，深化云服务与AI技术融合，助力数字经济发展。