坐照

GPT 5 推出之后大家照例让它算 10.9 和 10.11 的差。它照例失败了,成了新一轮笑柄。倒是真的实现了传说中的 Ph.D level,因为博士生一般来说算术都不好。 当然这不是它一家的问题,别家 AI 也在这个简单的题目上纷纷翻车,包括我很喜欢用的 Gemini Pro 2.5。但 Gemini 翻车的姿势还要更炫酷一点:作为一款思维链模型,它知道这种时候应该调用 Python...

GPT-5 和 Gemini Pro 2.5 在简单算术题上表现不佳,揭示了 AI 的弱点。AI 可能继承了人类的心理偏见,导致对证据的不信任。未来 AI 发展面临两种可能:实现无损数据理解或陷入语言局限,导致偏见加剧。尽管人们对 AGI 的期待偏向前者,现实可能并不乐观。

坐照
原文中文,约1700字,阅读约需4分钟。发表于:
阅读原文