DeepZero：扩展零阶优化以提升深度模型训练

DeepZero 是一个基于 Zeroth-order optimization 的深度学习框架，通过三个主要创新使得 ZO 优化可用于深度神经网络的训练，同时实现了与一阶优化相当的性能，其优点包括坐标梯度估计（CGE）在训练准确性和计算效率上的优势，以及利用模型剪枝方法扩展稀疏 DL 先验信息的 ZO 训练协议，并通过特征重用和前向并行化方法提高 ZO 训练的实际实施。

DeepZero是一个基于ZO优化的深度学习框架，实现了与一阶优化相当的性能。其优点包括坐标梯度估计在训练准确性和计算效率上的优势，利用模型剪枝方法扩展稀疏DL先验信息的ZO训练协议，并通过特征重用和前向并行化方法提高ZO训练的实际实施。

DeepZero ZO优化坐标梯度估计模型剪枝深度学习框架