结构之法算法之道 ·

微调LLama 3——七月论文审稿GPT第5版：拿早期paper-7方面review数据集微调LLama 3

💡 原文中文，约2900字，阅读约需7分钟。

📝

内容提要

本文介绍了对Llama 3模型进行微调的不同方法，包括使用PI和百度智能云的千帆大模型平台、Llama Factory和paper-review数据集以及不使用PI和S2-attn的调通Llama-3-8B-Instruct-262k模型。文章还提到了微调过程中的细节和结果。

🎯

❓

Llama 3模型的微调方法包括使用PI和百度智能云的千帆大模型平台、Llama Factory，以及不使用PI和S2-attn的调通方法。

可以通过Llama Factory提供的详细实战教程，在Colab的免费T4算力上微调Llama 3模型。

在使用A40显卡微调时，需要注意per_eval_device_batch size设置，以避免OOM错误。

微调结果可以通过与不同模型进行对比，评估Llama 3的性能，特别是与早期和晚期paper的review数据进行比较。

使用A100显卡时，需要关闭S2-attention，并可以直接使用12K长度进行训练。

社区发布了两款中文版Llama 3模型，分别是使用ORPO算法微调的Llama3-8B-Chinese-Chat和使用DoRA与LoRA+算法微调的Llama3-Chinese。

🏷️