小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
AI 论文周报丨DeepSeekMath-V2/医学视频图像分割/3D 重建/Qwen3-VL……一文速览 AI 前沿

DeepSeek开发的DeepSeekMath-V2在数学推理方面取得显著进展,尤其在定理证明中表现优异,获得国际数学奥林匹克金牌和普特南接近满分。该模型通过自我修正和验证循环提升推理能力。

AI 论文周报丨DeepSeekMath-V2/医学视频图像分割/3D 重建/Qwen3-VL……一文速览 AI 前沿

HyperAI超神经
HyperAI超神经 · 2025-12-06T03:01:13Z

本文提出了HybridProver,一种结合战术生成与整体证明合成的双模型证明框架,旨在解决形式化方法在关键系统可靠性验证中的应用障碍。实验结果显示,其在miniF2F数据集上的成功率达到59.4%,超越了之前的记录,为定理证明的自动化提供了新的视角。

HybridProver: LLM-Driven Proof Synthesis and Enhanced Theorem Proving

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究探讨中学数学向STEM教育转型的挑战,强调定理证明技术的应用,并总结国际研讨会成果,以促进计算机科学家、数学家与教育者之间的合作与理解。

Proceedings of the 13th International Workshop on Educational Software for Theorem Proving Components

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-07T00:00:00Z
人工智能学习数学:Kimina-Prover利用强化学习进行定理证明

本文总结了研究论文《AI学习数学:Kimina-Prover利用强化学习进行定理证明》。该方法结合强化学习与形式推理,专注于自动定理证明。Kimina-Prover作为形式数学推理的基础,通过自动生成多样的训练问题,并实施强化学习的证明搜索策略。

人工智能学习数学:Kimina-Prover利用强化学习进行定理证明

DEV Community
DEV Community · 2025-04-19T16:32:13Z

本研究提出了一种新方法BFS-Prover,通过最佳优先搜索有效探索证据空间。该方法通过数据过滤和提升样本效率,在MiniF2F测试集上获得71.31分,显示出其在定理证明任务中的竞争力。

BFS证明器:可扩展的基于最佳优先树搜索的LLM自动定理证明

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-05T00:00:00Z
构建网页应用程序的现代开发框架 | 开源日报 No.475

graphrag-accelerator 是一个在 Azure 上部署的知识图谱驱动的 RAG 解决方案,支持 API 端点和查询功能。infinity 是 AI 原生数据库,提供快速混合搜索。LeanCopilot 用于定理证明,兼容多种操作系统。Angular 是现代开发平台,支持多语言开发。Fay 是开源数字人框架,适用于多种应用场景。

构建网页应用程序的现代开发框架 | 开源日报 No.475

开源服务指南
开源服务指南 · 2025-01-09T23:35:40Z

本文介绍了LeanDojo,一个开源的交互式证明环境,以及其衍生的ReProver程序,能够有效选择定理前提。研究还提出了基于大型语言模型的数学推理工具,如InternLM-Math和Lean Copilot,展示了合成数据在定理证明中的潜力,并优化了形式证明的可读性和简洁性。此外,LeanAgent通过终身学习框架提升了高等数学定理证明的适应性和性能。

InternLM2.5-StepProver:通过专家迭代推动大规模LEAN问题的自动定理证明

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

本文探讨了基于高阶逻辑的定理证明研究及机器学习在其中的应用,包括CoqGym数据集、LeanDojo环境和ReProver程序。研究表明,利用大型语言模型和合成数据可以显著提升定理证明能力,Lean-STaR框架在miniF2F-test基准上表现优异,推动了定理证明的自动化进程。

泛图:一种用于先进定理证明、高级推理和数据提取的机器间交互界面

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

该研究探讨了大型语言模型在数学推理中的能力,提出了DELI和SCoP等方法以提高其准确性和鲁棒性。研究表明,模型对数学问题的表面形式敏感,微小变化会显著影响结果。通过新数据集和基准测试,评估了模型的推理能力,旨在推动深度学习在定理证明领域的发展。

MathGAP:在具有任意复杂证明的问题上的分布外评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

本文介绍了多种基于人工智能的定理证明方法,如LeanDojo、ReProver、TRIGO、DS-Prover和MUSTARD。这些方法通过数据生成和模型训练,提高了定理证明的效率和准确性,展示了AI在数学推理中的潜力。此外,研究提出了BAIT框架和DeepSeek-Prover-V1.5模型,优化了交互定理证明的性能,推动了相关领域的发展。

3D-Prover:基于行列式点过程的多样性驱动定理证明

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-14T00:00:00Z

本文介绍了多种基于大型语言模型的数学证明方法,如NaturalProver、DSP、LeanDojo和DeepSeek-Prover-V1.5。这些方法通过结合自然语言和符号,提高了证明生成的质量和效率,展示了在定理证明中的应用潜力。实验结果显示,这些模型在准确性和自动化程度上均有显著提升。

ImProver:基于智能体的自动化证明优化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

本文探讨了大型语言模型在自动形式化数学定理中的应用,展示了其将自然语言数学问题转化为形式化说明的能力。研究表明,使用Codex和GPT-4等模型能够有效提高定理证明的准确率,并提出了LeanDojo和ReProver等工具,推动了自动化证明的研究和数学形式化的进展。

数学中的人工智能:在Lean4中执行数学形式化问题解决和定理证明

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-09T00:00:00Z

本研究提出了DeepSeek-Prover-V1.5,一个用于Lean 4的开源语言模型,优化了定理证明的效率问题。模型采用了强化学习方法和RMaxTS变体,生成多样化的证明路径。在基准测试中,该模型在中学和本科水平上取得了显著的成绩提升,展示了其在推理任务中的潜在影响。

DeepSeek-Prover-V1.5:利用证明助手反馈提升强化学习和蒙特卡洛树搜索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码