坐照

GPT 5 推出之后大家照例让它算 10.9 和 10.11 的差。它照例失败了，成了新一轮笑柄。倒是真的实现了传说中的 Ph.D level，因为博士生一般来说算术都不好。当然这不是它一家的问题，别家 AI 也在这个简单的题目上纷纷翻车，包括我很喜欢用的 Gemini Pro 2.5。但 Gemini 翻车的姿势还要更炫酷一点：作为一款思维链模型，它知道这种时候应该调用 Python...

GPT-5 和 Gemini Pro 2.5 在简单算术题上表现不佳，揭示了 AI 的弱点。AI 可能继承了人类的心理偏见，导致对证据的不信任。未来 AI 发展面临两种可能：实现无损数据理解或陷入语言局限，导致偏见加剧。尽管人们对 AGI 的期待偏向前者，现实可能并不乐观。

AGI AI 偏见数据理解算术