小红花·文摘

本研究分析了大型语言模型（LLMs）在形式化验证任务中的表现。通过构建高质量的指令-响应对，微调后的 LLM 在证明编写方面显著提升了数学、推理和编码能力，为后续研究提供了新思路，并已公开微调模型。