小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
菲尔兹奖得主都看懵了:OpenAI非数学模型首次自主突破80年未解数学难题

OpenAI的通用模型成功解决了埃尔德什提出的单位距离问题,打破了近80年的数学共识,证明了点对数的增长速度是超线性的。这一成果引发了数学界的广泛关注。

菲尔兹奖得主都看懵了:OpenAI非数学模型首次自主突破80年未解数学难题

量子位
量子位 · 2026-05-21T09:36:23Z

字节推出的Seed Prover 1.5模型在IMO中获得金牌,成功解决前五道题目。该模型结合大规模强化学习与新形式化推理方法,显著提升了解题效率,并通过草稿和多工具交互更有效地处理复杂数学问题。

字节Seed发布最强数学模型:一招“打草稿”,IMO银牌变金牌

量子位
量子位 · 2025-12-25T06:10:36Z

DeepSeek推出的Prover-V2模型专注于数学定理证明,刷新多项基准测试记录。该7B模型成功解决了671B模型未能解决的问题,展现出独特的推理模式。Prover-V2结合强化学习与子目标分解,提升了形式化与非形式化证明的能力,标志着数学领域的重要进展。

DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能

量子位
量子位 · 2025-05-01T05:10:55Z
“安全”客观价值的数学模型:通过可预测性谈可持续性

安全的概念是指系统在多维参数空间中维持功能的可持续能力,而不仅仅是缺乏威胁。安全与生命、健康和爱的复杂互动构成一个系统。传统安全模型存在局限性,需要发展新的量子场和分形模型,以更准确地描述安全的基本原则,这些模型在人工智能等领域具有广泛应用潜力。

“安全”客观价值的数学模型:通过可预测性谈可持续性

DEV Community
DEV Community · 2025-03-16T07:53:52Z
健康价值的数学模型

量子健康花园是一个复杂系统,四棵树象征身体、心理、社会和环境健康。它们通过能量流相互影响,维持平衡。健康如同交响乐,各部分协调运作,创造和谐。该健康模型在价值体系中重要,支持自我实现和家庭发展,抵抗混乱,促进有序。可应用于AI,提升智能体稳定性和适应性,推动可持续发展。

健康价值的数学模型

DEV Community
DEV Community · 2025-03-08T21:33:58Z

本研究提出了一种新的理论框架,利用数学模型p-Conv有效识别自然数同余类,揭示神经网络行为的成功与失败模式,为可解释人工智能提供新视角。

Prime Convolution Model: Pioneering New Horizons for Theoretical Interpretability

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-04T00:00:00Z
DeepSeek R1:数学模型在复杂问题解决中以准确性换取速度

研究评估了DeepSeek R1模型在30个复杂数学问题上的表现,比较了其与其他四个语言模型的准确性和效率,揭示了解决方案的准确性与生成效率之间的权衡。

DeepSeek R1:数学模型在复杂问题解决中以准确性换取速度

DEV Community
DEV Community · 2025-02-03T09:01:43Z

本研究提出了AceMath数学模型套件,结合有效的奖励模型,通过监督微调显著提升数学问题解决能力,并建立了AceMath-RewardBench基准,最终在数学推理上取得最佳表现。

AceMath: Advancing Frontier Mathematical Reasoning through Post-Training and Reward Modeling

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z

本研究探讨了在代码混合对话中提取信息的挑战,特别是罗马字母化的孟加拉语与英语的混合。通过开发自动识别机制,显著提升了多语言和非正式文本环境中的信息检索效果。

RetrieveGPT:融合提示和数学模型以增强代码混合信息检索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z
不锈钢连续退火炉数学模型的复现

本文研究某钢厂的不锈钢连续退火炉,基于能量平衡建立炉气、炉围和带钢的方程,形成非线性方程组,构建热过程三元模型,并通过迭代法求解炉气温度。

不锈钢连续退火炉数学模型的复现

子虚栈
子虚栈 · 2024-11-01T08:39:30Z
Qwen2.5-Math: 世界领先的数学开源大语言模型

Qwen2.5-Math是新发布的数学专用大语言模型,支持中英双语解题,采用思维链和工具集成推理。与前代相比,Qwen2.5在数学解题能力上显著提升,特别是在MATH基准测试中表现优异。该模型通过合成高质量数据和强化学习训练,成为当前最先进的开源数学模型,推动了通用人工智能的发展。

Qwen2.5-Math: 世界领先的数学开源大语言模型

Blog on Qwen
Blog on Qwen · 2024-09-18T16:00:01Z

本研究提出Qwen2.5-Math系列数学专用语言模型,采用自我改进方法,提升数学推理能力。通过强化学习,模型能够有效解决多种难度的数学问题,推动数学教育与研究的进步。

Qwen2.5-Math Technical Report: Advancing Toward a Mathematical Expert Model via Self-Improvement

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z

滑铁卢大学、多伦多大学和卡内基梅隆大学的研究人员联合发布了MMLU-Pro数据集,用于评估大语言模型的能力。该数据集包含来自多个来源的问题,旨在更严格地测试大型语言模型的功能。该数据集已在hyper.ai提供下载。

MMLU-Pro 基准测试数据集上线,含 12k 个跨学科复杂问题,难度提升,更具挑战性!DeepSeek 数学模型一键部署

HyperAI超神经
HyperAI超神经 · 2024-09-14T09:16:07Z
MMLU-Pro基准测试数据集上线,含 12k 个跨学科复杂问题,难度提升,更具挑战性!DeepSeek 数学模型一键部署...

在大语言模型(LLM)发展的背景下,发布了MMLU-Pro数据集,以更严格地评估模型的语言理解能力。该数据集整合了多个来源的复杂问题,包含12K个跨学科问题,旨在推动AI在语言理解与推理方面的进步。

MMLU-Pro基准测试数据集上线,含 12k 个跨学科复杂问题,难度提升,更具挑战性!DeepSeek 数学模型一键部署...

HyperAI超神经
HyperAI超神经 · 2024-09-14T03:35:47Z
通义千问开源Qwen2-Math,成为最先进的数学专项模型

阿里通义团队开源了新一代数学模型Qwen2-Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型。Qwen2-Math-72B-Instruct在MATH基准测评中的准确率达到84%,超过其他开源数学模型。Qwen2-Math基础模型使用Qwen2大语言模型进行初始化,并在数学专用语料库上进行预训练。研发团队训练了指令微调版本模型,通过奖励模型和二元信号进行学习。Qwen2-Math目前主要支持英文,但将推出中英双语版本和多语言版本。阿里通义团队希望通过开源模型为科学界解决高级数学问题做出贡献。

通义千问开源Qwen2-Math,成为最先进的数学专项模型

机器之心
机器之心 · 2024-08-09T07:42:04Z
Qwen2-Math,新一代数学模型

Qwen2-Math是基于Qwen2构建的数学专用语言模型系列,旨在提升数学解题能力。旗舰模型Qwen2-Math-72B-Instruct在多个数学基准测试中表现优异,超越了GPT-4o等模型,并将推出中英双语版本,以满足更广泛的用户需求。

Qwen2-Math,新一代数学模型

Blog on Qwen
Blog on Qwen · 2024-08-07T16:00:00Z

本文探讨了基于神经网络的人工智能系统的仪表盘设计,强调用户建模和个性化服务的重要性。研究分析了用户在任务中的心理状态,并提出通过概率模型推断用户知识以提升交互性能。此外,文章讨论了人工智能在决策支持中的应用,倡导以人为中心的可解释性设计,以改善人机交互方式。

人工智能与用户相互塑造的会计学:数学模型的作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-18T00:00:00Z

该研究引入了一种新的评估范式来评估大型语言模型的认知能力,解决了现有基准测试中的关键缺陷,并能够有效区分模型之间的能力差异。研究结果显示,GPT-4的性能比GPT3-5高十倍,揭示了数学模型的训练和评估方法的根本缺陷。研究呼吁在评估语言模型时进行范式转变,并对人工通用智能的讨论做出了贡献。通过推广类似的评估方法,旨在更准确地评估语言模型的认知能力。

挑战 LLMs 的推理能力:揭示 LLMs 中的认知深度的基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-28T00:00:00Z

本论文提出了一种新颖的端到端网络,用于生成未来肿瘤掩模和不同治疗计划下肿瘤在任何未来时间点的真实磁共振成像。该模型基于扩散概率模型和深度分割神经网络,通过使用多参数MRI和治疗信息作为条件输入,指导生成扩散过程,以估算给定时间点的肿瘤成长。通过使用真实的手术后纵向MRI数据进行训练,验证了该模型在生成合成MRI、肿瘤分割和不确定性估计等任务中的优异性能。该模型的肿瘤成长预测能够为临床决策提供有用的信息。

个性化预测脑胶质母细胞瘤浸润:数学模型、物理启发神经网络和多模式扫描

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-28T00:00:00Z

本文介绍了微信红包的数学模型和抢红包的算法。指出红包的总金额和参与人数决定了最大金额,而抢红包的顺序决定了运气。建议在其他人抢完后再进行抢夺。

速看!!教你如何抢红包

京东科技开发者
京东科技开发者 · 2023-11-07T11:42:18Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码