本研究提出了一种新方法——确定性表示知识流(CRaFT),旨在解决拒绝感知指令调优中的过度拒绝问题。通过结合响应的确定性和初步复习训练,显著提高了大型语言模型的表现,减少了错误拒绝已知问题的情况。
完成下面两步后,将自动完成登录并继续当前操作。