小红花·文摘 - 小红花技术领袖俱乐部

智能体“记忆权”争夺战：谁掌握记忆与行动控制权，谁就掌握你的未来

智能体“记忆权”争夺战：谁掌握记忆与行动控制权，谁就掌握你的未来

极道 ·

L-Zero通过可验证奖励的强化学习（RLVR）实现了模型的自主进化，增强了探索、验证和记忆能力。研究团队构建了端到端的智能体训练系统L0，并提出了结构化智能体框架NB-Agent，显著提升了模型在多项基准测试中的表现，展示了向更高级通用智能发展的潜力。

性能提升84%-166%！L-Zero仅靠强化学习解锁大模型探索世界的能力 | 已开源

量子位 ·

ICLR 2025 Spotlight｜让机器人实现「自主进化」，蚂蚁数科、清华提出具身协同框架 BodyGen

ICLR 2025 Spotlight｜让机器人实现「自主进化」，蚂蚁数科、清华提出具身协同框架 BodyGen

机器之心 ·