SkyRL - 一个模块化的全栈强化学习(RL)库,专为大语言模型设计

SkyRL - 一个模块化的全栈强化学习(RL)库,专为大语言模型设计

云原生 云原生 ·

SkyRL是一个专注于大语言模型训练与评估的模块化强化学习库,提供环境构建、训练和部署功能,旨在实现可重复的研究与工程。其主要特点包括模块化组件、高性能训练管道和丰富的环境套件,适用于多轮对话任务和算法评估。

原文英文,约200词,阅读约需1分钟。
阅读原文