本文介绍了LDAdam,一种内存高效的优化器,适用于大模型训练。它在低维子空间内自适应优化,同时探索完整参数空间,降低内存占用,并通过新规则实现语言模型的高效微调和预训练。
完成下面两步后,将自动完成登录并继续当前操作。