小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate

OpenAI推理模型负责人Jerry Tworek宣布离职,计划探索OpenAI难以开展的研究领域。他在OpenAI工作近七年,参与了GPT-4和Codex等项目,强调推理的重要性,离职后希望继续推动机器智能的发展。

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

量子位
量子位 · 2026-01-06T05:06:28Z

AI终于学会「读懂人心」,带飞DeepSeek R1,OpenAI o3等模型

机器之心
机器之心 · 2025-11-20T06:48:14Z

Mini-o3是字节与港大联合开发的开源视觉推理模型,支持多轮深度推理,突破传统模型限制。通过冷启动微调和强化学习,Mini-o3在视觉搜索任务中表现优异,显著超越现有模型,提供多样化推理模式。

全新开源模型复现o3视觉推理,无需大量训练即可实现深度思考

量子位
量子位 · 2025-09-15T07:46:06Z

大模型碰到真难题了,测了500道,o3 Pro仅通过15%

机器之心
机器之心 · 2025-09-14T05:23:42Z

蚂蚁集团发布的MedResearcher-R1模型仅用2100条训练样本,在医疗AI测试中超越通用大模型,展示了专业模型在医疗领域的优势。该模型通过创新训练方法和专用工具,提高了医疗研究的准确性和效率,彰显小规模模型的潜力。

蚂蚁专用模型超越o3!仅用2K训练样本刷新医疗AI榜单纪录

量子位
量子位 · 2025-08-29T05:27:36Z

GPT-5在《宝可梦水晶》中以9517步击败赤爷,效率是普通玩家的三倍,后者通常需5天完成游戏。GPT-5的快速通关得益于较少的“幻觉”、强大的空间推理和目标规划能力,引发了玩家热议。

GPT-5通关《宝可梦水晶》创纪录!9517步击败赤爷,效率碾压o3三倍!

量子位
量子位 · 2025-08-26T09:32:40Z

GPT-5、Grok 4、o3 Pro都零分,史上最难AI评测基准换它了

机器之心
机器之心 · 2025-08-15T05:12:46Z

OpenAI发布了gpt-oss-120b和gpt-oss-20b两款开源大模型,前者适合复杂推理,后者适合低延迟应用。gpt-oss采用MoE架构,性能强大且计算需求低,支持在消费级硬件上运行。评测显示,gpt-oss-120b在多个任务中优于o3-mini,gpt-oss-20b表现也很出色。用户可通过HyperAI官网体验和部署这些模型。

一键部署 gpt-oss-20b,实测开源推理模型新 SOTA,性能直逼 o3‑mini

HyperAI超神经
HyperAI超神经 · 2025-08-11T02:43:04Z

OpenAI发布了gpt-oss-120b和gpt-oss-20b两个开源大模型,前者适合复杂推理,后者适合低延迟应用。两者在多项测试中表现优异,能够在消费级硬件上运行,满足多场景需求。

一键部署 gpt-oss-20b,实测开源推理模型新 SOTA,性能直逼 o3‑mini

HyperAI超神经
HyperAI超神经 · 2025-08-07T19:32:43Z

谷歌推出的IMO金牌模型Gemini 2.5 Deep Think在推理性能上超越o3和Grok 4,专为Ultra订阅用户设计。该模型在数学和科学领域表现优异,能够加速研究和算法开发,具备并行思维能力,提升问题解决效率。

谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4

量子位
量子位 · 2025-08-02T01:45:22Z

Sdcb Chats 1.6.3 正式发布,升级至 .NET 9.0,内存占用降低57%。新增支持 o3-pro 深度思考模型,提升复杂问题分析能力。核心依赖库全面更新,增强安全性与兼容性。

Sdcb Chats 1.6.3 正式发布:大幅降低内存占用,支持 o3-pro 深度思考

dotNET跨平台
dotNET跨平台 · 2025-07-17T00:02:25Z

OpenAI的o3在新的「解答科学问题AI排行榜」上排名第一,DeepSeek的R1排名第二

机器之心
机器之心 · 2025-07-14T02:17:38Z

马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6根手指

机器之心
机器之心 · 2025-07-11T08:59:04Z

ICML 2025 | 清华、上海AI Lab提出专家级医学基准MedXpertQA,看o3、R1哪家强

机器之心
机器之心 · 2025-07-08T05:01:32Z
LWiAI播客第212期 - O3 PRO、Cursor 1.0、ProRL、Midjourney被起诉

在第212期节目中,讨论了上周的AI新闻,包括OpenAI推出的O3 PRO提升了ChatGPT的性能和成本效益,Anthropic吸引了OpenAI和DeepMind的人才以增强AI能力,研究显示强化负面反馈能显著提升LLM性能,以及微软Copilot的安全漏洞暴露了AI代理被黑客攻击的风险。

LWiAI播客第212期 - O3 PRO、Cursor 1.0、ProRL、Midjourney被起诉

Last Week in AI
Last Week in AI · 2025-06-17T22:24:25Z
OpenAI推出o3-pro模型,专注于可靠性,用户反馈褒贬不一

OpenAI推出了o3-pro,这是其最新模型,旨在提高复杂任务的响应可靠性。该模型适用于Pro和Team用户,支持Python等工具。尽管在准确性和深度上有所提升,但响应速度较慢,用户对幻觉问题表示担忧,目前不支持图像生成等功能。

OpenAI推出o3-pro模型,专注于可靠性,用户反馈褒贬不一

InfoQ
InfoQ · 2025-06-17T18:20:00Z

OpenAI最新的推理模型o3-pro受到关注,但测试显示其推理能力有限,常常只对部分字母正确。前员工Miles Brundage批评苹果的推理研究为模式匹配。o3-pro在短上下文中表现良好,但在长上下文处理上不如Gemini 2.5 Pro。用户Ben Hylak认为,o3-pro需要更多背景信息以发挥最佳能力,并在工具使用和环境理解上有所提升。

o3-pro答高难题文字游戏引围观,OpenAI前员工讽刺苹果:这都不叫推理那什么叫推理

量子位
量子位 · 2025-06-13T03:50:16Z

OpenAI推出o3-pro模型,售价80美元,性能优于o3和o1-pro,特别擅长数学和编程。o3降价80%,每百万输入tokens仅需2美元。尽管o3-pro在高难任务上表现出色,但响应时间较慢且价格较高,部分用户对o3的智能水平表示质疑。

o3-pro正式推出!说声“嗨”就花了80美元,思考1+1用时16分钟

量子位
量子位 · 2025-06-11T02:56:08Z

刚刚,OpenAI正式发布o3-pro!奥特曼激动更新博客:温和的奇点

机器之心
机器之心 · 2025-06-11T02:24:43Z
OpenAI推出旗舰推理模型o3-pro 在各方面全面提升且表现优异 附API价格

OpenAI推出的新推理模型o3-pro,能深入思考并提供精准回答,尤其在数学、科学和编程方面表现突出。该模型适用于ChatGPT Pro和Team用户,但响应时间较长。o3-pro支持工具调用,能够进行网页搜索和个性化响应,但暂不支持图像生成和Canvas功能。

OpenAI推出旗舰推理模型o3-pro 在各方面全面提升且表现优异 附API价格

蓝点网
蓝点网 · 2025-06-11T01:50:29Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码