Hilbert是一个结合非正式推理与正式验证的框架,旨在提升形式证明的生成能力。它通过递归分解问题,将复杂任务拆分为子目标,并利用专门的证明LLM和验证器进行求解。实验结果表明,Hilbert在多个基准测试中表现优异,解决了70%的问题,显著超越现有方法,缩小了非正式推理与正式证明之间的差距。
本研究提出了TrustGeoGen,一个可扩展的正式验证数据引擎,旨在解决几何问题求解中的不足。该引擎通过多模态对齐生成和形式验证,显著提高了模型的逻辑一致性和泛化能力。
完成下面两步后,将自动完成登录并继续当前操作。