AGI今天起有了量化标准!Bengio牵头定义,当前进度条58%
💡
原文中文,约2600字,阅读约需7分钟。
📝
内容提要
Bengio等人定义AGI为能匹配或超越受过良好教育成年人的智能。研究团队设计了500道题目评估AI的认知能力,目前主流AI如GPT-4得分27,GPT-5得分58,仍未达到AGI的100分标准,尤其在感知和记忆方面存在明显短板。
🎯
关键要点
- Bengio等人定义AGI为能匹配或超越受过良好教育成年人的智能。
- AGI的评估标准包括认知广度和熟练度,避免模糊表述。
- 研究团队设计了500道题目评估AI的认知能力,基于CHC理论。
- 评估采用百分制,总分达到100分即判定为AGI水平。
- GPT-4得分27,GPT-5得分58,仍未达到AGI的100分标准。
- 当前AI在知识、读写和数学领域表现突出,但在感知和记忆方面存在短板。
- AI的优势集中在知识储备与符号处理,核心短板在感知、记忆和推理等领域。
- 部分大模型通过技术手段掩盖短板,无法实现真正的长期记忆。
- 评估体系专注于AI的原生认知能力,不考虑外部工具的辅助。
➡️