智能体的能力依赖于其大脑模型、身体设计和记忆管理。若控制权交给闭源平台,将失去数据主权,限制系统的演化能力。开放系统可确保数据自由迁移和系统升级,促进智能体的自主进化。因此,选择开放或闭源将影响未来的控制权和发展潜力。
L-Zero通过可验证奖励的强化学习(RLVR)实现了模型的自主进化,增强了探索、验证和记忆能力。研究团队构建了端到端的智能体训练系统L0,并提出了结构化智能体框架NB-Agent,显著提升了模型在多项基准测试中的表现,展示了向更高级通用智能发展的潜力。
清华大学与蚂蚁数科团队提出的BodyGen框架,通过强化学习实现机器人自主进化,快速生成适应环境的最佳形态与控制策略。该研究在ICLR 2025上获得Spotlight论文,展示了在机器人设计与仿生研究中的应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。