💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
在SFT阶段,知识遗忘显著,需要通过混合训练(如hybrid-turning和structTuning)重新输入知识。参考SHADOW-FT,通过在BASE模型上进行SFT和对齐训练,利用BASE和INSTUCT模型的一致性,解决场景选择和目标设定问题。
🎯
关键要点
-
SFT阶段导致知识的灾难性遗忘明显。
-
需要通过混合训练(如hybrid-turning和structTuning)重新输入知识。
-
参考SHADOW-FT的工作,利用BASE模型和INSTUCT模型的一致性。
-
在BASE模型上进行SFT和对齐训练,以解决场景选择和目标设定问题。
-
通过叠加变化的参数与Instuct模型获取相似效果。
➡️