Prime Intellect发布INTELLECT-2：一款通过去中心化强化学习训练的32亿参数模型

Prime Intellect has released INTELLECT-2, a 32 billion parameter language model trained using fully asynchronous reinforcement learning across a decentralized network of compute contributors....

Prime Intellect发布了基于去中心化网络的32亿参数语言模型INTELLECT-2，采用完全异步强化学习。该模型使用PRIME-RL框架，分离生成、更新和广播任务，通过SHARDCAST分发模型权重，并通过TOPLOC验证推理结果。INTELLECT-2在285,000个数学和编程任务上训练，表现优于前代模型。未来计划包括提升推理与训练的计算比率及整合更多工具。

INTELLECT-2 SHARDCAST TOPLOC 去中心化强化学习