本研究探讨了大型语言模型(LLMs)在引导自动定理证明器(ATPs)推理策略中的能力。评估了GPT-4、GPT-3.5 Turbo和Gemini模型在特定问题上的表现,发现LLMs倾向于自下而上的推理过程,并在处理小型公式集时表现良好。此外,嵌入方法在处理更广泛的模态逻辑时优于原生模态逻辑ATP系统。
完成下面两步后,将自动完成登录并继续当前操作。