小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Google announced Aletheia, an AI using Gemini 3 Deep Think that solved 6/10 novel math problems in the FirstProof challenge. Aletheia also scored ~91.9% on IMO-ProofBench, signaling a significant...

Google’s Aletheia Advances the State of the Art of Fully Autonomous Agentic Math Research

InfoQ
InfoQ · 2026-04-19T04:38:00Z

加载模型时出现错误,提示'importlib_metadata'模块缺少'EntryPoints'属性,导致无法执行。

【Triton 教程】math-ops

HyperAI超神经
HyperAI超神经 · 2026-04-01T10:37:20Z
mAceReason-Math:一个高质量的多语言数学问题数据集,支持强化学习与可验证奖励(RLVR)

mAceReason-Math是一个高质量的多语言数学问题数据集,支持强化学习与可验证奖励(RLVR)研究。该数据集包含来自AceReason-Math语料库的挑战性数学问题翻译,覆盖14种语言,每种语言超过10,000个样本,旨在提升多语言RLVR的研究和基准测试。

mAceReason-Math:一个高质量的多语言数学问题数据集,支持强化学习与可验证奖励(RLVR)

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-13T00:00:00Z

本文深入分析了RSA加密中的信息泄露风险,揭示了hint如何影响RSA的安全性。通过数学分析,探讨了hint与n的关系,并利用小因子进行因数分解,成功破解RSA并解密flag,强调了数学在密码学攻击中的重要性。

解析2025LitCTF-math

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-11-10T01:14:41Z

本文探讨了基于2×2矩阵的CTF密码学题目,运用Cayley-Hamilton定理推导有限域扩域理论,并通过商环计算成功恢复加密矩阵中的flag,展示了数学推导与算法的优雅与简洁。

解析2025LitCTF ez_math

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-11-09T14:00:33Z

机器之心数据服务已上线,提供高效稳定的数据获取,简化爬取流程。

We-Math 2.0:全新多模态数学推理数据集 × 首个综合数学知识体系

机器之心
机器之心 · 2025-08-27T12:46:20Z

本文探讨了Math.Pow函数的性能不足,通过天体模拟程序测试发现,使用r2 * Math.Sqrt(r2)的速度是Math.Pow的2.7倍。作者在AI建议下进行了深入验证,结果表明通用函数在特定场景下效率低下,强调了性能优化和数据驱动决策的重要性。

C#性能优化:为何 x * Math.Sqrt(x) 远胜 Math.Pow(x, 1.5)

dotNET跨平台
dotNET跨平台 · 2025-07-29T00:02:22Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。

菲尔兹奖得主深度参与,WAIC全方位探讨「AI for Math」

机器之心
机器之心 · 2025-07-27T14:48:43Z
css:math - 使用 shape() 创建正多边形

本文展示了作者制作的一支笔的过程。

css:math - 使用 shape() 创建正多边形

DEV Community
DEV Community · 2025-05-25T04:31:38Z
在Python中实现无库的数学算法(不使用math、pandas或matplotlib)

本文探讨如何在Python中实现基本数学算法,包括判断一个整数是否为完全平方数和寻找大于n的下一个质数。这些练习有助于提升算法思维和解决问题的能力。

在Python中实现无库的数学算法(不使用math、pandas或matplotlib)

DEV Community
DEV Community · 2025-04-30T13:57:55Z

本研究提出了一种基于强化学习的自动数学纠错方法StepAMC,解决了现有方法忽视逐步反馈的问题。该模型增强了大语言模型的推理能力,在两个基准数据集上超越了十一种强基线模型,显示出显著的性能提升。

Teaching Large Models for Step-Level Automatic Math Correction via Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z

本研究提出FANS框架,旨在提升大语言模型在自然语言数学推理中的推理能力和答案准确性。通过将数学问题转化为Lean4定理,并利用Lean4证明器验证答案,显著提高了答案选择的准确性。

FANS - Formal Answer Selection for Natural Language Math Reasoning Based on Lean4

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-05T00:00:00Z

这篇文章介绍了Arstar Math,展示了小型语言模型(参数不超过70亿)如何通过自我演化的深度思维掌握数学推理。该方法结合蒙特卡洛树搜索和过程奖励模型,解决了训练中的数据不足问题。通过生成高质量的数学问题和逐步验证推理轨迹,模型在数学基准测试中的表现显著提升,最终达到了与大型模型相媲美的效果。

论文解读:Arstar Math:小型语言模型如何通过自我演化的深度思维掌握数学推理

Josherich的博客
Josherich的博客 · 2025-03-02T00:00:01Z

本研究针对现有多模态数学基准仅限于单一视觉环境的不足,提出了MV-MATH数据集,包含2009个高质量数学问题。这些问题结合了多张图像与文本,来自真实K-12场景,旨在为评估多模态大型语言模型在多视觉环境中的数学推理能力提供全面严格的基准。实验表明,现有多模态大型语言模型在多视觉数学任务中面临显著挑战,表现与人类能力存在较大差距。

MV-MATH: 评估多视觉环境中的多模态数学推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-28T00:00:00Z
编写一个程序,根据半径计算圆的面积,使用公式 A = Math.PI * Math.pow(raio, 2)

本文介绍了如何使用 JavaScript 编写程序计算圆的面积,公式为 A = Math.PI * Math.pow(raio, 2),适合初学者。

编写一个程序,根据半径计算圆的面积,使用公式 A = Math.PI * Math.pow(raio, 2)

DEV Community
DEV Community · 2025-02-27T21:48:34Z

本研究提出了Big-Math数据集,包含超过25万个高质量数学问题,专为语言模型的强化学习设计。通过严格筛选,确保问题的可验证性和开放性,并新增47000个问题,以提升语言模型的推理能力。

Big-Math: A Large-Scale, High-Quality Math Dataset for Reinforcement Learning in Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-24T00:00:00Z
Python基础:库的介绍 第1部分

Aadarsh介绍了Python中的三个库:Math用于数学运算,Time用于时间控制,Random用于生成随机数。使用这些库前需进行导入。

Python基础:库的介绍 第1部分

DEV Community
DEV Community · 2025-02-17T23:46:53Z
Building a custom math tutor powered by ChatGPT

ChatGPT and personal tutoring

Building a custom math tutor powered by ChatGPT

OpenAI
OpenAI · 2025-02-04T00:00:00Z
微软研究院推出rStar-Math:推动小型语言模型的数学推理能力

微软研究院推出rStar-Math框架,展示小型语言模型在数学推理中的优越能力,甚至超过大型模型。该框架采用蒙特卡洛树搜索(MCTS)方法,通过自我进化提升模型和训练数据质量。在多个数学基准测试中,rStar-Math表现出色,准确率显著提高,并作为开源项目供研究人员使用。

微软研究院推出rStar-Math:推动小型语言模型的数学推理能力

InfoQ
InfoQ · 2025-01-23T06:00:00Z
让7B千问模型超越o1,微软rStar-Math惊艳登场,网友盛赞

OpenAI的o1模型在大规模推理上取得了突破,但成本较高。微软研究院提出的rStar-Math小模型经过自我进化,数学推理能力超越o1,且成本低,展现出强大潜力。

让7B千问模型超越o1,微软rStar-Math惊艳登场,网友盛赞

机器之心
机器之心 · 2025-01-10T06:16:46Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码