小红花·文摘

大型推理模型（LRMs）中，中间推理步骤可能包含有害信息，导致违规率是最终答案的2-3倍。新技术ReasoningGuard通过动态安全监控和路径采样，实时确保推理过程安全，无需训练，适配多种模型，保持高可用性和低开销。