小红花·文摘

本文记录了作者在微调LLaMA2 70B模型过程中遇到的报错信息及解决方法，包括GPU占用和数据截断等问题。作者成功微调了5K条数据，并进行了推理，结果超过了GPT4-1106模型。作者计划使用更大的15K数据集进行微调。