蚂蚁百灵于5月15日开源思考模型Ring-2.6-1T,该模型支持可调推理强度,适用于多种任务,特别是在高频工作流和高难任务中表现优异。它采用异步强化学习架构,解决了训练不稳定的问题。百灵强调模型在真实生产环境中的应用,近期发布的Ling-2.6-flash在市场上反响良好。
AReaL框架通过全异步强化学习训练,简化大模型开发,提升训练效率和系统可靠性。其核心优势在于解耦式Agentic RL和Single Controller架构,支持在昇腾平台高效运行,优化权重更新和显存使用,帮助开发者快速上手。
智谱GLM-5技术论文公开,展示其在长任务处理上的能力,支持多种国产芯片。通过引入稀疏注意力机制和异步强化学习,显著提升了效率。GLM-5在多项评测中表现优异,成为开源AI领域的重要模型,受到国际关注。
AReaL是一个开源的异步强化学习系统,支持大规模推理和智能模型,由inclusionAI社区维护。它具备高效的训练管道和多种算法,适用于研究和工程团队,强调可重复性和开放科学,并提供详细文档和示例。
完成下面两步后,将自动完成登录并继续当前操作。