小红花·文摘

本研究提出了一种多维约束框架，用于评估和提升大语言模型的指令遵循能力。该框架包括三种约束模式、四类约束和四个难度等级，生成了1,200个可验证的测试样本，结果显示模型在不同约束下的表现存在显著差异。使用该方法生成的数据显著提高了模型的指令遵循能力。