利用计算机视觉估计自然场景中数量和非数量视觉大小的分布

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究使用大规模Transformer架构的生成式人工智能模型,调查了命名简单视觉刺激中的物体数量的可靠性。结果显示,基础模型在人类方式下表现不佳,缺乏直观理解数字的基本能力。

🎯

关键要点

  • 本研究使用大规模Transformer架构的生成式人工智能模型。
  • 研究调查了命名简单视觉刺激中的物体数量的可靠性。
  • 基础模型在人类方式下表现不佳,存在明显错误。
  • 即使在小数量下,响应的变异性也没有按系统方式增加。
  • 错误的模式随物体类别而变化。
  • 研究结果表明高级人工智能系统缺乏直观理解数字的基本能力。
➡️

继续阅读