量子位 ·

AGI今天起有了量化标准！Bengio牵头定义，当前进度条58%

💡 原文中文，约2600字，阅读约需7分钟。

📝

内容提要

Bengio等人定义AGI为能匹配或超越受过良好教育成年人的智能。研究团队设计了500道题目评估AI的认知能力，目前主流AI如GPT-4得分27，GPT-5得分58，仍未达到AGI的100分标准，尤其在感知和记忆方面存在明显短板。

🎯

关键要点

Bengio等人定义AGI为能匹配或超越受过良好教育成年人的智能。
AGI的评估标准包括认知广度和熟练度，避免模糊表述。
研究团队设计了500道题目评估AI的认知能力，基于CHC理论。
评估采用百分制，总分达到100分即判定为AGI水平。
GPT-4得分27，GPT-5得分58，仍未达到AGI的100分标准。
当前AI在知识、读写和数学领域表现突出，但在感知和记忆方面存在短板。
AI的优势集中在知识储备与符号处理，核心短板在感知、记忆和推理等领域。
部分大模型通过技术手段掩盖短板，无法实现真正的长期记忆。
评估体系专注于AI的原生认知能力，不考虑外部工具的辅助。

🏷️

继续阅读

“给中国供应芯片等于卖核弹”？Anthropic CEO达沃斯激进言论震惊全场，谷歌DeepMind掌门人为何温和反击？｜AGI Demis Hassabis Dario Amodei
在2026年达沃斯论坛上，Anthropic CEO阿姆戴伊将向中国出售芯片比作向朝鲜出售核武器，认为风险极大，并批评中国科技未能赶上美国，强调芯片禁令的...
当前可购买的最佳即时相机
这篇文章介绍了几款最受欢迎的即时相机，包括富士、宝丽来和柯达等品牌。文章提到，选择即时相机时需要考虑照片质量、易用性、价格和适用性等因素。富士Instax...
仅限今天，您可以以不到200美元的价格购买AirPods Pro 3
Woot以39.99美元出售翻新版恒温器，较新款便宜40美元。The Verge评测称，该预算恒温器功能强大，适应用户习惯，并与亚马逊Alexa兼容，是嵌...
Quant Trader，量化&风控开发工程师，Golang 工程师
该公司在香港招聘量化交易员、量化与风控开发工程师及Golang工程师，要求候选人具备实盘经验和扎实的Python与Golang技术能力，团队氛围扁平且稳定性高。
开放支付标准x402在重大升级中扩展功能
开放支付标准x402在六个月的实际使用后进行了重大更新，V2版本支持钱包身份、自动API发现和动态支付接收者，增强了协议的通用性和灵活性，支持多链和法币，...
NVIDIA DRIVE AV提升车辆安全标准，梅赛德斯-奔驰CLA荣获欧洲NCAP最佳奖
AI驱动的驾驶辅助技术已成为标准配置，改变了车辆安全评估方式。梅赛德斯-奔驰CLA凭借NVIDIA DRIVE AV软件在2025年欧洲NCAP中表现最佳...

AGI今天起有了量化标准！Bengio牵头定义，当前进度条58%

内容提要

关键要点

标签

继续阅读