量子位 ·

吴恩达：图灵测试不够用了，我会设计一个AGI专用版

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

吴恩达计划设计新的图灵-AGI测试，以评估人工智能的经济性和实际产出，超越传统图灵测试，旨在更准确地判断AGI水平，减少炒作，促进AI领域的实际进步。

🎯

🔎

随着AGI概念的兴起，传统的图灵测试已无法满足评估AI的需求。吴恩达提出的新测试将更关注AI的实际工作能力，旨在提供一个更准确的标准，以避免公众对AI能力的误解。

图灵-AGI测试允许裁判自由设计任务，这种灵活性使得测试能够更全面地评估AI的通用能力。与固定测试集相比，这种方法能够更真实地反映AI在实际应用中的表现，减少模型在特定领域的过度优化。

吴恩达的图灵-AGI测试不仅有助于校准社会对AI的期望，还可能促使行业重新关注实际进步，而非追逐AGI的营销噱头。这将为AI领域创造一个更稳健的发展环境，推动有实用价值的应用落地。

❓

新图灵-AGI测试旨在评估人工智能的经济性和实际产出，超越传统图灵测试，更准确地判断AGI水平。

传统图灵测试主要通过人机对话来评估智能，无法衡量AI的工作能力和经济价值，已不再适应AGI时代的需求。

测试将通过多日体验任务来评估AI的表现，裁判可以自由设计任务，要求AI完成知识型工作。

图灵-AGI测试允许裁判自由设计任务，不受固定测试集限制，更能考验AI的通用能力，而现有基准测试常常误导大众。

吴恩达希望通过图灵-AGI测试校准社会对AI的期望，减少炒作，推动AI领域的实际进步。

图灵-AGI测试将为AI团队设定具体目标，推动实际进步，而非仅仅追求营销噱头。

🏷️