机器之心 ·

美欧亚三洲开发者联手，全球首个组团训练的大模型来了，全流程开源

💡 原文中文，约4000字，阅读约需10分钟。

📝

内容提要

Prime Intellect于11月22日宣布完成去中心化训练的10B模型INTELLECT-1，并开源相关资源。该模型在112台H100 GPU上训练，展示了去中心化训练的潜力。尽管汉语能力较弱，但整体获得AI社区积极反馈。未来，Prime Intellect计划扩大模型规模，推动开源AGI发展。

🎯

关键要点

Prime Intellect于11月22日宣布完成去中心化训练的10B模型INTELLECT-1，并开源相关资源。
该模型在112台H100 GPU上训练，展示了去中心化训练的潜力。
INTELLECT-1实现了10倍的规模提升，证明大规模模型训练不再是大公司的专利。
未来计划是将模型扩展到前沿规模，最终目标是实现开源AGI。
AI社区对INTELLECT-1总体给予积极反馈，尽管存在一些质疑。
模型的汉语能力较弱，且存在幻觉现象。
去中心化训练涉及3个大洲的5个国家，运行了112台H100 GPU。
训练过程中实现了83%的总体计算利用率，证明了去中心化训练的有效性。
INTELLECT-1基于Llama-3架构，训练数据集包含1万亿token。
训练持续了42天，采用了多种技术以提高学习效率和稳定性。
Prime框架支持容错训练和动态计算资源管理，优化了全球分布式GPU网络的通信。
计算效率在不同地理位置的网络延迟下依然保持高水平。
后训练阶段与Arcee AI合作，提升模型能力和特定任务表现。
未来计划包括扩大全球计算网络，激励社区参与，优化去中心化训练架构。

🏷️

继续阅读

从 OpenSwiftUI 到 DanceUI：换个方式 Dive SwiftUI - 肘子的 Swift 周报 #132
自2019年发布以来，SwiftUI逐渐成为苹果开发者的重要工具，但其闭源特性使得开发者难以深入理解。为此，社区希望通过开源项目复刻SwiftUI。最近，...
突破零样本 TTS 音色克隆上限：LongCat-AudioDiT 的声音克隆艺术
美团LongCat团队发布了LongCat-AudioDiT模型，采用全新的端到端文本转语音技术，减少信息损失。该模型在Seed基准测试中表现优异，取得最...
Pi-hole原理深度解析：用DNS重写广告分发生态实现全网设备无广告体验
Pi-hole通过DNS拦截广告和追踪请求，为全网设备提供无广告体验。它维护域名黑名单，阻止广告和恶意网站，运行成本低且性能优越。开源特性增强用户信任，提...
为什么许多初学者自学开发者会遇到困难（以及应对方法）
自学开发者常缺乏结构化指导，导致学习困难。文章探讨了大脑处理信息的方式，强调认知负荷理论、间隔重复和刻意练习的重要性。有效学习需理解大脑机制，合理管理认知...
《堡垒之夜》开发者现在可以创建AI角色——但请不要试图与他们约会
Epic Games在Fortnite中推出新的“对话”工具，允许开发者创建可与玩家互动的AI角色。该工具使用Google的Gemini 3.1模型处理音...
商汤医疗完成A轮融资，估值突破10亿美元，领跑全球医疗世界模型赛道
商汤医疗完成超过5亿元人民币的A轮融资，估值突破10亿美元，成为独角兽。融资将用于加速医疗AI产品研发，构建未来医疗AI基础设施。CEO张少霆表示，医疗世...

美欧亚三洲开发者联手，全球首个组团训练的大模型来了，全流程开源

内容提要

关键要点

标签

继续阅读