小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Rustup 1.29.0于2026年3月12日发布,新增并发下载和检查更新功能,提升工具链安装性能,支持sparcv9-sun-solaris等平台,并优化环境变量处理和退出码。欢迎新成员加入团队。

【Rust日报】2026-03-11 ry(o3) - Python的Rust封装库

Rust.cc
Rust.cc · 2026-03-14T02:44:48Z

OpenAI推理模型负责人Jerry Tworek宣布离职,计划探索OpenAI难以开展的研究领域。他在OpenAI工作近七年,参与了GPT-4和Codex等项目,强调推理的重要性,离职后希望继续推动机器智能的发展。

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

量子位
量子位 · 2026-01-06T05:06:28Z
AI终于学会「读懂人心」,带飞DeepSeek R1,OpenAI o3等模型

抱歉,提供的文本内容不足以进行总结。请提供更详细的文章内容。

AI终于学会「读懂人心」,带飞DeepSeek R1,OpenAI o3等模型

机器之心
机器之心 · 2025-11-20T06:48:14Z

Mini-o3是字节与港大联合开发的开源视觉推理模型,支持多轮深度推理,突破传统模型限制。通过冷启动微调和强化学习,Mini-o3在视觉搜索任务中表现优异,显著超越现有模型,提供多样化推理模式。

全新开源模型复现o3视觉推理,无需大量训练即可实现深度思考

量子位
量子位 · 2025-09-15T07:46:06Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。

大模型碰到真难题了,测了500道,o3 Pro仅通过15%

机器之心
机器之心 · 2025-09-14T05:23:42Z

蚂蚁集团发布的MedResearcher-R1模型仅用2100条训练样本,在医疗AI测试中超越通用大模型,展示了专业模型在医疗领域的优势。该模型通过创新训练方法和专用工具,提高了医疗研究的准确性和效率,彰显小规模模型的潜力。

蚂蚁专用模型超越o3!仅用2K训练样本刷新医疗AI榜单纪录

量子位
量子位 · 2025-08-29T05:27:36Z

GPT-5在《宝可梦水晶》中以9517步击败赤爷,效率是普通玩家的三倍,后者通常需5天完成游戏。GPT-5的快速通关得益于较少的“幻觉”、强大的空间推理和目标规划能力,引发了玩家热议。

GPT-5通关《宝可梦水晶》创纪录!9517步击败赤爷,效率碾压o3三倍!

量子位
量子位 · 2025-08-26T09:32:40Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

GPT-5、Grok 4、o3 Pro都零分,史上最难AI评测基准换它了

机器之心
机器之心 · 2025-08-15T05:12:46Z

OpenAI发布了gpt-oss-120b和gpt-oss-20b两款开源大模型,前者适合复杂推理,后者适合低延迟应用。gpt-oss采用MoE架构,性能强大且计算需求低,支持在消费级硬件上运行。评测显示,gpt-oss-120b在多个任务中优于o3-mini,gpt-oss-20b表现也很出色。用户可通过HyperAI官网体验和部署这些模型。

一键部署 gpt-oss-20b,实测开源推理模型新 SOTA,性能直逼 o3‑mini

HyperAI超神经
HyperAI超神经 · 2025-08-11T02:43:04Z

OpenAI发布了gpt-oss-120b和gpt-oss-20b两个开源大模型,前者适合复杂推理,后者适合低延迟应用。两者在多项测试中表现优异,能够在消费级硬件上运行,满足多场景需求。

一键部署 gpt-oss-20b,实测开源推理模型新 SOTA,性能直逼 o3‑mini

HyperAI超神经
HyperAI超神经 · 2025-08-07T19:32:43Z

谷歌推出的IMO金牌模型Gemini 2.5 Deep Think在推理性能上超越o3和Grok 4,专为Ultra订阅用户设计。该模型在数学和科学领域表现优异,能够加速研究和算法开发,具备并行思维能力,提升问题解决效率。

谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4

量子位
量子位 · 2025-08-02T01:45:22Z

Sdcb Chats 1.6.3 正式发布,升级至 .NET 9.0,内存占用降低57%。新增支持 o3-pro 深度思考模型,提升复杂问题分析能力。核心依赖库全面更新,增强安全性与兼容性。

Sdcb Chats 1.6.3 正式发布:大幅降低内存占用,支持 o3-pro 深度思考

dotNET跨平台
dotNET跨平台 · 2025-07-17T00:02:25Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

OpenAI的o3在新的「解答科学问题AI排行榜」上排名第一,DeepSeek的R1排名第二

机器之心
机器之心 · 2025-07-14T02:17:38Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6根手指

机器之心
机器之心 · 2025-07-11T08:59:04Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

ICML 2025 | 清华、上海AI Lab提出专家级医学基准MedXpertQA,看o3、R1哪家强

机器之心
机器之心 · 2025-07-08T05:01:32Z
利用OpenAI o3、GPT-4.1和CUA推动可扩展增长

Unify是一个基于AI的销售平台,通过智能化的信息寻找和个性化服务,帮助团队高效接触潜在客户。该系统自动化繁琐工作,使团队专注于客户互动,旨在通过数据驱动提升销售增长,优化产品与客户的匹配。

利用OpenAI o3、GPT-4.1和CUA推动可扩展增长

OpenAI
OpenAI · 2025-06-24T00:00:00Z
LWiAI播客第212期 - o3 Pro、Cursor 1.0、ProRL、Midjourney被起诉

OpenAI推出O3 Pro,显著提升ChatGPT性能并降低80%价格。Anthropic吸引OpenAI和DeepMind人才,增强AI能力。研究显示,负面强化能显著提升大型语言模型的表现。微软Copilot的安全漏洞暴露了AI代理被黑客攻击的风险。

LWiAI播客第212期 - o3 Pro、Cursor 1.0、ProRL、Midjourney被起诉

Last Week in AI
Last Week in AI · 2025-06-17T22:24:25Z
OpenAI推出o3-pro模型,专注于可靠性,用户反馈褒贬不一

OpenAI推出了o3-pro,这是其最新模型,旨在提高复杂任务的响应可靠性。该模型适用于Pro和Team用户,支持Python等工具。尽管在准确性和深度上有所提升,但响应速度较慢,用户对幻觉问题表示担忧,目前不支持图像生成等功能。

OpenAI推出o3-pro模型,专注于可靠性,用户反馈褒贬不一

InfoQ
InfoQ · 2025-06-17T18:20:00Z

OpenAI最新的推理模型o3-pro受到关注,但测试显示其推理能力有限,常常只对部分字母正确。前员工Miles Brundage批评苹果的推理研究为模式匹配。o3-pro在短上下文中表现良好,但在长上下文处理上不如Gemini 2.5 Pro。用户Ben Hylak认为,o3-pro需要更多背景信息以发挥最佳能力,并在工具使用和环境理解上有所提升。

o3-pro答高难题文字游戏引围观,OpenAI前员工讽刺苹果:这都不叫推理那什么叫推理

量子位
量子位 · 2025-06-13T03:50:16Z

OpenAI推出o3-pro模型,售价80美元,性能优于o3和o1-pro,特别擅长数学和编程。o3降价80%,每百万输入tokens仅需2美元。尽管o3-pro在高难任务上表现出色,但响应时间较慢且价格较高,部分用户对o3的智能水平表示质疑。

o3-pro正式推出!说声“嗨”就花了80美元,思考1+1用时16分钟

量子位
量子位 · 2025-06-11T02:56:08Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码