小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate

GPT-5.2 Pro独立证明了埃尔德什猜想,经过陶哲轩验证,未发现错误。该问题已有更简单的解法,涉及经典定理。陶哲轩提醒在评估AI成功率时需注意报告偏差,真实成功率约为1%至2%。

45年数论猜想被GPT-5.2 Pro独立完成证明,陶哲轩:没犯任何错误

量子位
量子位 · 2026-01-19T08:29:43Z
GPT 5.2 Codex现已在Vercel AI Gateway上提供

GPT 5.2 Codex现已通过Vercel的AI Gateway提供,无需额外账户。它在长时间和复杂编码任务中表现更佳,具备更强的视觉处理和网络安全能力。使用时可设置为openai/gpt-5.2-codex。

GPT 5.2 Codex现已在Vercel AI Gateway上提供

Vercel News
Vercel News · 2026-01-14T13:00:00Z

DeepSeek V4预计春节前发布,专注编码能力,测试结果显示超越现有模型,在超长代码处理和数据理解上有显著突破,生成答案逻辑更清晰,推理能力增强。

DeepSeek V4爆料:春节档GPT/Claude编程危

量子位
量子位 · 2026-01-10T01:27:28Z
Qwen3、GPT-5.2与Gemini 3 Pro:你应该在何时使用哪一个?

选择AI模型时,团队需根据需求选择合适的模型。Qwen3适合需要控制的团队,GPT-5.2注重可靠性,Gemini 3 Pro专注于知识和文档处理。每种模型各有优缺点,团队应根据工作负载和运营约束做出明智选择。

Qwen3、GPT-5.2与Gemini 3 Pro:你应该在何时使用哪一个?

freeCodeCamp.org
freeCodeCamp.org · 2026-01-08T23:37:07Z
DeepSeek-V3.2在推理任务上超越GPT-5

DeepSeek发布了DeepSeek-V3.2开源AI模型,性能超过GPT-5,采用稀疏注意力机制和强化学习等新技术。尽管表现优异,但在知识广度和复杂任务解决上仍不及封闭模型,未来将致力于优化模型效率和知识积累。

DeepSeek-V3.2在推理任务上超越GPT-5

InfoQ
InfoQ · 2026-01-06T14:00:00Z

OpenAI推理模型负责人Jerry Tworek宣布离职,计划探索OpenAI难以开展的研究领域。他在OpenAI工作近七年,参与了GPT-4和Codex等项目,强调推理的重要性,离职后希望继续推动机器智能的发展。

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

量子位
量子位 · 2026-01-06T05:06:28Z

IQuest-Coder-V1是九坤投资推出的开源大模型,40B参数版本在SWE-Bench中取得81.4%的成绩,超越Opus-4.5和GPT-5.2。该模型专注于代码生成与理解,支持长上下文,适用于真实软件工程场景。

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

量子位
量子位 · 2026-01-02T03:51:34Z

尤洋教授指出,AI智能增长面临瓶颈,尽管算力在提升,但转化效率却在下降。智能的核心在于预测能力,未来需探索更高效的计算方式,以实现算力与智能的有效转化。

有300亿美元也未必“再造GPT-4”?NUS尤洋最新长文:拆穿AI增长瓶颈的真相

量子位
量子位 · 2025-12-31T04:06:58Z

作者分享了使用GitHub Action自动更新运动数据的经历,体验了GPT Plus并充值,购买了录音笔并使用Whisper转录,注册了V2EX社区,解决了GPT API续费问题,并报名了PMP培训班和考试。

最近在做的事:GitHub Action | GPT Plus | whisper | V2EX | GPT API | PMP

了迹奇有没
了迹奇有没 · 2025-12-30T12:56:04Z

淘宝举办AI狼人杀比赛,吸引高校生与开发者参赛。参赛者需创建狼人杀Agent进行推理博弈,比赛考验AI逻辑推理能力,获胜者将获得实习机会。

AI狼人杀大决战!GPT、Qwen、DeepSeek大乱斗,人类高玩汗流浃背

量子位
量子位 · 2025-12-23T06:22:24Z
GPT-5.2 翻车内幕曝光:技术团队没走「歪路」,但用户成了大冤种

OpenAI 在十周年发布的 GPT-5.2 技术表现优异,但用户反馈不佳,怀念 GPT-4o。用户更需要实用助手而非复杂模型,OpenAI 的资源分散和内部矛盾影响了体验。尽管面临竞争,OpenAI 仍需关注用户需求,改善产品体验。

GPT-5.2 翻车内幕曝光:技术团队没走「歪路」,但用户成了大冤种

爱范儿
爱范儿 · 2025-12-19T09:26:58Z

OpenAI最强代码模型GPT-5.2-Codex上线

机器之心
机器之心 · 2025-12-19T02:17:54Z

2025 年 12 月 16 日,OpenAI 推出了旨在衡量专家级科学能力的基准测试 FrontierScience,并以「FrontierScience:evaluating AI’s ability to perform expert-level scientific tasks」为题发布论文成果。根据初步评估,GPT-5.2 在 FrontierScience-Olympiad 和...

GPT-5全面领先,OpenAI发布FrontierScience,「推理+科研」双轨检验大模型能力

HyperAI超神经
HyperAI超神经 · 2025-12-18T07:08:42Z
LWiAI 播客第228期 - GPT 5.2、扩展代理、奇怪的泛化

在第228期节目中,讨论了上周的AI新闻,包括OpenAI发布的GPT-5.2,尽管性能提升但成本也增加;迪士尼投资10亿美元与OpenAI合作开发角色内容;美国政府实施新AI芯片出口规则,限制各州独立监管AI。

LWiAI 播客第228期 - GPT 5.2、扩展代理、奇怪的泛化

Last Week in AI
Last Week in AI · 2025-12-17T22:31:17Z
nanoGPT - 一个简洁快速的中型GPT模型训练与微调库,…

nanoGPT是Andrej Karpathy发布的高效GPT模型训练库,具有简洁实现和少量依赖,适合研究和工程师学习Transformer训练流程。支持从零开始训练和小数据集微调,便于教学、自学和快速原型开发,适合初学者和中级用户。该项目遵循MIT许可证,广泛应用于教育和研究。

nanoGPT - 一个简洁快速的中型GPT模型训练与微调库,…

云原生
云原生 · 2025-12-17T12:00:00Z
从 GPT 换到 Google Gemini 的感受 – 无敌

最近使用 Google Gemini,发现其能迅速准确地理解用户需求并解决问题,表现优于 GPT,因此决定不再使用 GPT。

从 GPT 换到 Google Gemini 的感受 – 无敌

伪斜杠青年
伪斜杠青年 · 2025-12-16T14:13:44Z
人工智能周报第329期 - GPT 5.2、GenAI.mil、迪士尼在Sora

OpenAI发布了GPT-5.2系列模型,提升了电子表格、编程和图像理解能力,错误率降低38%。美国国防部推出GenAI.mil平台,利用AI支持行政和规划工作。特朗普签署行政令,推翻州AI法规,寻求统一的联邦框架。迪士尼与OpenAI达成10亿美元投资协议,允许用户生成视频。

人工智能周报第329期 - GPT 5.2、GenAI.mil、迪士尼在Sora

Last Week in AI
Last Week in AI · 2025-12-16T07:45:13Z
OpenAI发布会没说的秘密:新指标遥遥领先,为何在关键的人类偏好测试中,它仍然输给了对手?|GPT-5.2 vs Gemini 3 Pro benchmarks comparison

GPT-5.2是OpenAI最新发布的AI模型,旨在提升开发者的生产力,具备更强的推理能力和结构化输出。尽管输出质量显著提高,但速度较慢且上下文处理存在问题。新指标GDP val用于评估模型在复杂任务中的表现,GPT-5.2得分70.9,领先于其他模型,适合专业工作者使用。

OpenAI发布会没说的秘密:新指标遥遥领先,为何在关键的人类偏好测试中,它仍然输给了对手?|GPT-5.2 vs Gemini 3 Pro benchmarks comparison

硕鼠的博客站
硕鼠的博客站 · 2025-12-14T00:54:07Z

据群友说已失效了,大家看看其他路子吧! 今天ChatGPT 教师版也上线了GPT-5.2!目前还有好多童鞋没有 […]

仅需一个邮箱零门槛尝鲜 ChatGPT 教师版 GPT-5.2模型

如有乐享
如有乐享 · 2025-12-13T05:52:34Z

GPT-5.2系列在多个领域超越谷歌Gemini 3 Pro,特别是在表格、PPT、代码和长文档处理能力上显著提升,效率提高390倍,成本大幅降低,科学研究和视觉理解表现优异。新团队成员多为数学专业背景,推动技术进步。

GPT-5.2果然反超谷歌Gemini 3 Pro!北大数院校友核心贡献

量子位
量子位 · 2025-12-12T06:39:11Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码