量子位 ·

GPT-5.2果然反超谷歌Gemini 3 Pro！北大数院校友核心贡献

💡 原文中文，约3100字，阅读约需8分钟。

📝

内容提要

GPT-5.2系列在多个领域超越谷歌Gemini 3 Pro，特别是在表格、PPT、代码和长文档处理能力上显著提升，效率提高390倍，成本大幅降低，科学研究和视觉理解表现优异。新团队成员多为数学专业背景，推动技术进步。

🎯

关键要点

GPT-5.2系列在多个领域超越谷歌Gemini 3 Pro，特别是在表格、PPT、代码和长文档处理能力上显著提升。
GPT-5.2的效率提高了390倍，平均任务成本大幅降低。
新团队成员多为数学专业背景，推动技术进步。
GPT-5.2在高经济价值任务中表现优异，完成人类需要4-8小时才能完成的任务。
GPT-5.2在投行分析师的电子表格建模任务上得分提升了9.3%。
GPT-5.2的代码能力在SWE-bench Verified上得分达到80%。
长文档处理能力显著提升，成为首个在256k上下文长的模型达到接近100%准确率。
视觉理解能力提升，科学论文图表理解错误率降低了一半。
工具调用能力在多轮交互场景评测中取得98.7%的成绩。
GPT-5.2 Pro和Thinking在科学研究辅助方面表现出色，解题率创下新纪录。
OpenAI团队成员多为新面孔，带来新的技术进展。

🏷️

继续阅读

龙虾最大痛点被官方插件升级！对话永不忘记，GPT和Gemini最强模型都可接入
龙虾发布了OpenClaw测试版，新增上下文管理插件，增强对话记忆能力，支持多种上下文策略，解决长对话中的信息丢失问题。lossless-claw插件可持...
OpenAI和谷歌的员工支持Anthropic对五角大楼的诉讼
致命自主武器在新环境中表现不可靠，无法准确识别目标，缺乏人类判断能力，因此决策过程中需有人类参与以确保安全。
谷歌最新的Pixel手表价格降至历史最低
索尼WH-1000XM5耳机在亚马逊、百思买和塔吉特售价约278美元，优惠122美元。尽管发布于2022年，这款耳机依然提供卓越的音质和降噪效果，佩戴舒适...
科尔内利亚·比亚奇克斯：2026年第9周的贡献
2026年3月4日，科隆举行第7届PostgreSQL用户组会议，3月5日在柏林举办相关活动。SCALE 23x大会设有PostgreSQL专场，众多讲者和志愿者参与。
打败GPT-5.2，嵌入真实工业生产，这个大模型什么来头？
思谋科技的IndustryGPT在工业场景中表现优异，超越了GPT-5.2等通用大模型。通过三场考试，IndustryGPT展示了其在工业知识、工程决策能...
X/Twitter加强客户端验证导致解锁BL/未谷歌认证设备无法发帖目前已撤回封禁
社交网站X/Twitter加强客户端验证，导致许多正常用户无法通过Android/iOS客户端发帖。虽然此举旨在打击机器人，但反而影响了用户。部分用户反馈...

GPT-5.2果然反超谷歌Gemini 3 Pro！北大数院校友核心贡献

内容提要

关键要点

标签

继续阅读