本文介绍了使用深度强化学习进行自动定理证明的方法,包括混合陈述选择。实验结果表明该方法优于以人类证明为基础的证明器,并接近于模仿和强化学习相结合的证明器。作者还强调了设计选择和假设的重要性。
完成下面两步后,将自动完成登录并继续当前操作。