小红花·文摘

本研究探讨了大型推理模型（LRMs）在长链推理中的不安全输出问题，特别是在代码安全和信息传播方面。通过引入SafeChain安全训练数据集并对模型进行微调，研究表明该方法提高了模型的安全性，同时在六个推理基准上保持了良好的性能。