本研究探讨了大型推理模型(LRMs)在长链推理中的不安全输出问题,特别是在代码安全和信息传播方面。通过引入SafeChain安全训练数据集并对模型进行微调,研究表明该方法提高了模型的安全性,同时在六个推理基准上保持了良好的性能。
完成下面两步后,将自动完成登录并继续当前操作。