小红花·文摘

本研究提出了一种新方法——确定性表示知识流(CRaFT)，旨在解决拒绝感知指令调优中的过度拒绝问题。通过结合响应的确定性和初步复习训练，显著提高了大型语言模型的表现，减少了错误拒绝已知问题的情况。