小红花·文摘

本研究探讨了大型语言模型（LLMs）在引导自动定理证明器（ATPs）推理策略中的能力。评估了GPT-4、GPT-3.5 Turbo和Gemini模型在特定问题上的表现，发现LLMs倾向于自下而上的推理过程，并在处理小型公式集时表现良好。此外，嵌入方法在处理更广泛的模态逻辑时优于原生模态逻辑ATP系统。