小红花·文摘

$单位距离构造的综述$

单位距离构造的综述

What's new by TerryTao ·

OpenAI模型已推翻离散几何中的一个核心猜想

OpenAI ·

AlphaEvolve在基因组学、网格优化、地球科学和量子物理等领域取得显著进展。它提高了DeepConsensus模型的准确性，减少了DNA测序错误；在电力流优化中，解决方案的可行性提升至88%；自然灾害风险预测的准确性提高5%；在量子计算中优化了分子模拟，降低了错误率。此外，该系统还帮助解决经典数学问题，提升了旅行商问题和拉姆齐数的下界。

AlphaEvolve：我们的Gemini驱动编码代理如何在各个领域扩大影响力

Google DeepMind Blog ·

mAceReason-Math：一个高质量的多语言数学问题数据集，支持强化学习与可验证奖励（RLVR）

Apple Machine Learning Research ·

AlphaEvolve：AI 打破 56 年数学纪录，发现更快的矩阵乘法算法

Micropaper ·

链式思维在推理中的潜力：对轨迹动态的深入探讨

Apple Machine Learning Research ·

英特尔DeepMath推出智能架构，提高大型语言模型的数学能力

InfoQ ·

字节推出的Seed Prover 1.5模型在IMO中获得金牌，成功解决前五道题目。该模型结合大规模强化学习与新形式化推理方法，显著提升了解题效率，并通过草稿和多工具交互更有效地处理复杂数学问题。

字节Seed发布最强数学模型：一招“打草稿”，IMO银牌变金牌

量子位 ·

知名数学家小野肯辞去终身教职，加入学生洪乐潼创办的AI公司Axiom，专注于开发数学问题解决的AI。Axiom已解决多个数学难题，吸引了众多顶尖人才，师生合作有望推动数学与AI的结合。

知名数学家辞职投身AI创业：老板是00后华人女生

量子位 ·

GPT-5与数学发现的未来

OpenAI ·

有限域上的新Nikodym集合构造

What's new by TerryTao ·

大规模数学探索与发现

What's new by TerryTao ·

Langchain与MCP的结合增强了工具的功能。Langchain 1.0版本统一了代理创建方式，简化了使用MCP工具的过程。文章展示了如何通过标准I/O和服务器发送事件（SSE）两种模式利用MCP服务器解决数学问题，并提供了示例代码。这一集成提升了Langchain代理的灵活性和可扩展性。

langchain + MCP：如虎添翼

鸟窝 ·

谷歌AI Ultra订阅者现在可以在Gemini应用中使用Deep Think工具。该工具通过并行思维解决复杂问题，特别在编码和科学发现方面表现出色。Deep Think经过改进，能够更快地处理复杂数学问题，并在2025年国际数学奥林匹克中达到铜牌水平。用户可通过Gemini应用中的提示栏启用该工具。

在Gemini应用中尝试Deep Think

Google DeepMind Blog ·

ChatGPT-5能否提供高级数学的证明？

MachineLearningMastery.com ·

这个“智能助手”帮助大型语言模型在文本与代码之间切换

MIT News - Artificial intelligence ·

Robinhood CEO Vlad Tenev与Tudor Achim联合创立了人工智能初创公司Harmonic AI，专注于解决复杂数学问题，目标是构建超越人类的数学能力AI系统。Harmonic AI已完成B轮融资，估值接近9亿美元，致力于实现通用人工智能（AGI）。

美国版梁文锋来了

量子位 ·

MathFusion通过顺序、并行和条件三种融合策略提升大语言模型在数学问题上的能力，利用45K合成指令使准确率提高18%。该方法有效捕捉问题间深层联系，展现出优越的数据效率和性能，适用于更复杂的数学问题。

大模型“拼好题”，45K数据撬动18%提升，数学问题拒绝死记硬背 | MathFusion

量子位 ·

中国女孩洪乐潼创立的AI公司Axiom专注于数学问题解决，目标估值为3-5亿美元。她是斯坦福大学的数学博士，曾获多项奖学金，计划为对冲基金提供数学模型支持。

00后中国女孩0产品创业实现3亿估值：斯坦福数学博士的AI量化野心

量子位 ·

AlphaEvolve是一个基于大型语言模型的进化编码代理，旨在发现和优化算法。它结合了创意问题解决能力和自动评估器，提升了谷歌的数据中心效率、芯片设计和AI训练。AlphaEvolve在数学和计算领域取得了显著进展，包括发现更快的矩阵乘法算法，并在多个开放数学问题上取得突破，展现出广泛的应用潜力。

AlphaEvolve：一个基于Gemini的编码代理，用于设计先进算法

Google DeepMind Blog ·