本研究分析了大型语言模型(LLMs)在形式化验证任务中的表现。通过构建高质量的指令-响应对,微调后的 LLM 在证明编写方面显著提升了数学、推理和编码能力,为后续研究提供了新思路,并已公开微调模型。
完成下面两步后,将自动完成登录并继续当前操作。