DONOD: Achieving Robust and Generalizable Instruction Fine-Tuning for Large Language Models via Model-Intrinsic Dataset Pruning

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了DONOD方法,通过模型参数评估和TOPSIS算法,解决了大型语言模型在特定领域微调中的泛化能力不足和噪声数据问题。实验结果表明,使用DONOD筛选的数据显著提高了准确率。

🎯

关键要点

  • 本研究提出了DONOD方法,旨在解决大型语言模型在特定领域微调中的泛化能力不足和噪声数据问题。
  • DONOD方法通过模型参数评估和TOPSIS算法有效过滤噪声和不适合学习的样本。
  • 实验结果显示,使用DONOD筛选的数据在目标领域和跨领域的准确率显著提高。
  • 该方法改善了微调的效率和稳健性。
➡️

继续阅读