ARTHURCHIAO'S BLOG ·

[译] 关于 AI 下半场的思考：技术/模型篇（2025）

💡 原文中文，约8100字，阅读约需20分钟。

📝

内容提要

本文讨论了人工智能发展的新阶段，强调从“解决问题”转向“定义问题”。提到强化学习的泛化能力和预训练的重要性，并指出现有评估方法与现实世界脱节，限制了AI在经济等领域的影响。未来需重新审视评估方式，以提升AI的实际效用。

🎯

🔎

文章指出，人工智能的发展已进入下半场，重心从解决问题转向定义问题。这一转变意味着评估方法的重要性将超过训练过程，未来的研究需要关注如何有效衡量AI的进展，以确保其在现实世界中的应用效果。

强化学习的泛化能力被强调为AI发展的关键。通过结合推理和预训练，AI能够在多种任务中表现出色。这一能力的提升使得AI在特定任务上的表现不再依赖于新算法，而是通过已有的知识和技能实现更高的效率。

尽管AI在许多领域超越了人类，但其对经济等现实世界的影响仍然有限。文章提到，现有的评估方法与现实世界的需求存在脱节，未来需要重新审视这些评估设置，以提升AI的实际效用和应用价值。

❓

人工智能发展的新阶段强调从解决问题转向定义问题，评估方法的重要性提升。

强化学习的泛化能力和预训练被强调，使其能够完成各种任务，成为实现人工智能的重要工具。

现有评估方法与现实世界脱节，限制了人工智能在经济等领域的实际影响。

未来需要重新审视评估方式，开发针对现实世界效用的新评估设置，以提升人工智能的实际效用。

因为评估能够更好地衡量人工智能的进展和实际应用效果，而不仅仅是训练模型的能力。

尽管人工智能在许多领域超越人类，但对真实世界的经济影响仍然有限。

🏷️