Measuring the Ability of Artificial Intelligence to Complete Long Tasks

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新的度量标准——50%任务完成时间标准,以评估人工智能在现实世界中的能力。研究表明,当前AI模型完成任务的时间约为50分钟,自2019年以来,其能力每七个月翻倍,未来五年可能使AI自动化许多人类需一个月完成的任务。

🎯

关键要点

  • 本研究提出了一种新的度量标准——50%任务完成时间标准,用于评估人工智能在现实世界中的能力。
  • 当前前沿AI模型完成任务的时间约为50分钟。
  • 自2019年以来,AI模型的能力每七个月翻倍。
  • 未来五年,AI可能自动化许多人类需一个月完成的任务。
➡️

继续阅读