BriefGPT - AI 论文速递 ·

SMART：指令调优的子模数据混合策略

💡 原文中文，约1300字，阅读约需3分钟。

📝

内容提要

本文研究了指令优化在模型转移学习中的应用，提出了多模态指令调优基准数据集MultiInstruct，并探讨了fine-tuning方法以提升多任务学习性能。研究引入了CoTBal算法和结构因果模型，增强了NLP任务的效果，并展示了SMI函数在数据选择中的有效性。

🎯

❓

MultiInstruct是第一个多模态指令调优基准数据集，旨在设计多个特定任务和专家编写的指令，以优化模型的强零示性能。

SMI函数通过选择数据子集来解决深度学习模型训练中的数据问题，能够提升分类性能20-30%。

CoTBal算法用于大型多模态模型的多任务视觉指令调整，能够提升整体性能。

子集fine-tuning方法只对部分层进行调整，能够在数据稀缺的情况下实现与完全fine-tuning模型相当或更好的性能，且不增加计算成本。

LESS算法用于有效估计数据影响，并执行用于指令数据选择的低秩梯度相似性搜索，通常使用5%的数据训练优于全数据集。

结构因果模型整合不同的NLP任务，通过使用与特定任务相关的因果因素进行预测，提高零样本能力并避免伪相关性。

🏷️