强化学习之父Richard Sutton预测,当前大语言模型的主导地位是暂时的,未来AI将依赖通过Agent与世界互动获取“体验数据”。他指出,模仿人类思维只能带来短期提升,长期发展需依赖扩展计算和强化学习,以实现自主学习和创新。
完成下面两步后,将自动完成登录并继续当前操作。