新研究提出“人类最后考试”(HLE),由近1000名专家设计2500道难题,以评估AI的深度理解能力。结果显示,当前AI表现不佳,预计到2025年可达到50%的准确率。HLE重新定义了AI评估标准,强调人类专业知识的独特性。
完成下面两步后,将自动完成登录并继续当前操作。