层次感知任务算术:解耦任务特定知识与指令遵循知识

📝

内容提要

本研究解决了大语言模型在多任务学习中的知识重叠导致性能下降的问题。我们提出了一种新方法——层次感知任务算术(LATA),通过赋予任务向量层特定权重,有效区分任务特定和指令遵循知识。实验结果表明,LATA在多任务学习和选择性任务遗忘中均显著提升了任务准确性,同时较好地保持了整体模型的实用性。

➡️

继续阅读