全球闲置算力训个模型,性能媲美R1,老黄天塌了!Karpathy曾投资它

💡 原文中文,约5200字,阅读约需13分钟。
📝

内容提要

全球首个分布式强化学习模型INTELLECT-2发布,利用闲置算力进行训练,显著降低成本,性能接近DeepSeek-R1。该模型去中心化,任何人可参与训练,可能改变大公司对算力的垄断。团队已获得Karpathy等投资,未来将扩展去中心化训练。

🎯

关键要点

  • 全球首个分布式强化学习模型INTELLECT-2发布,利用闲置算力进行训练,显著降低成本。
  • INTELLECT-2的性能与DeepSeek-R1媲美,可能改变大公司对算力的垄断。
  • 模型去中心化,任何人可参与训练,团队已获得Karpathy等投资。
  • INTELLECT-2采用全球分布式异步强化学习的范式,允许闲置算力资源参与。
  • 模型训练过程涉及四大关键组件:PRIME-RL、SHARDCAST、TOPLOC和Protocol Testnet。
  • PRIME-RL实现推理数据生成与模型训练的解耦与异步执行,提升性能。
  • SHARDCAST负责将更新后的模型权重高效分发给全球推理节点,采用分片传输和多级缓存技术。
  • TOPLOC验证推理节点生成数据的可信性,确保模型训练的安全性。
  • Protocol Testnet为计算资源管理和任务调度提供统一接口,支持去中心化管理。
  • INTELLECT-2在数学和编程基准测试中表现提升,成功实现通信和计算的重叠。
  • 团队曾获Karpathy投资,计划扩大计算市场,推进去中心化训练。

延伸问答

INTELLECT-2模型的主要特点是什么?

INTELLECT-2是首个去中心化的分布式强化学习模型,利用闲置算力进行训练,显著降低成本,性能与DeepSeek-R1媲美。

INTELLECT-2如何改变算力的使用方式?

INTELLECT-2通过去中心化的训练方式,使任何人都可以参与模型训练,可能终结大公司对算力的垄断。

INTELLECT-2的训练过程涉及哪些关键组件?

训练过程涉及PRIME-RL、SHARDCAST、TOPLOC和Protocol Testnet四大关键组件。

SHARDCAST在INTELLECT-2中起什么作用?

SHARDCAST负责将更新后的模型权重高效分发给全球推理节点,采用分片传输和多级缓存技术。

TOPLOC协议如何确保数据的可信性?

TOPLOC通过密码学证明和可验证计算技术,验证推理节点提交的数据的可信性,避免恶意数据影响模型训练。

INTELLECT-2的团队背景如何?

INTELLECT-2的团队Prime Intellect位于旧金山,创始人Vincent Weisser和CTO Johannes Hagemann均有丰富的创业和技术背景。

➡️

继续阅读