大型推理模型(LRMs)中,中间推理步骤可能包含有害信息,导致违规率是最终答案的2-3倍。新技术ReasoningGuard通过动态安全监控和路径采样,实时确保推理过程安全,无需训练,适配多种模型,保持高可用性和低开销。
完成下面两步后,将自动完成登录并继续当前操作。