用于Gemma2全参数持续预训练的弹性权重巩固

📝

内容提要

本研究解决了大语言模型在持续学习过程中面临的灾难性遗忘问题。通过应用弹性权重巩固(EWC),我们探索了其对模型的新任务学习的积极影响,研究结果表明,该方法显著减轻了遗忘效应,并可能有助于提升语言理解能力。

🏷️

标签

➡️

继续阅读