七月论文审稿GPT第4.5版：通过15K条paper-review数据微调Llama2 70B(含各种坑)

原文约7600字，阅读约需19分钟。发表于：。

当我们3月下旬微调完mixtral 8x7B之后，下一个想微调的就是llama2 70B因为之前积攒了不少微调代码和微调经验，所以3月底apple便通过5K的paper-review数据集成功微调llama2 70B，但过程中也费了不少劲考虑到最后的成功固然令人欣喜，但真正让一个人或一个团队快速涨经验的还是那些在训练过程中走过的踩过的各种坑以及走过的各种弯路，所以本文第一部分我会把apple在训练中的遇到各种报错信息而一步步debug、或各种搜Google、搜GitHub的过程都整理出来。

本文记录了作者在微调LLaMA2 70B模型过程中遇到的报错信息及解决方法，包括GPU占用和数据截断等问题。作者成功微调了5K条数据，并进行了推理，结果超过了GPT4-1106模型。作者计划使用更大的15K数据集进行微调。