小红花·文摘

本研究提出UltraIF方法，旨在缩小开源大语言模型与企业训练模型在复杂指令遵循上的差距。通过将用户提示分解为简单查询和评估问题，UltraIF显著提升了指令遵循能力。实验表明，LLaMA-3.1-8B-Base在无基准信息情况下，成功与指令版本一致，展示了广泛应用潜力。