The Cloudflare Blog ·

Cloudflare R2和MosaicML实现全球任意计算设备上训练大型语言模型，零切换成本

💡 原文英文，约1500词，阅读约需6分钟。

📝

内容提要

为了支持生成式人工智能的大型语言模型和扩散模型，需要大量的基础设施，包括GPU和数据存储基础设施。许多机器学习团队已经开始使用对象存储来托管数据集和检查点。MosaicML的工具和Cloudflare R2可以一起解决这些挑战。使用MosaicML的开源StreamingDataset和Composer库，可以轻松地将训练数据流式传输并将模型检查点读/写回R2。由于R2的零出口定价，您可以根据GPU的可用性和价格启动/停止/移动/调整作业，而无需支付任何数据传输费用。

🎯

关键要点

构建生成式人工智能所需的大型语言模型和扩散模型需要大量基础设施，包括GPU和数据存储。
许多机器学习团队开始使用对象存储来托管数据集和检查点，但大多数对象存储提供商收取出口费用，限制了用户的灵活性。
MosaicML的工具和Cloudflare R2可以解决存储成本和可扩展性的问题，支持高效的数据流和模型检查点的读写。
使用MosaicML的开源StreamingDataset和Composer库，可以轻松地将训练数据流式传输并将模型检查点写回R2。
R2的零出口定价使得用户可以根据GPU的可用性和价格灵活启动、停止、移动和调整作业，而无需支付数据传输费用。
MosaicML和Cloudflare的结合使得用户可以在全球任何计算环境中训练大型语言模型，且没有供应商锁定。
使用StreamingDataset库可以高效、确定性地从R2读取数据，并支持多工作者的高性能训练。
Composer库简化了模型检查点的保存和加载过程，支持多GPU和多节点训练，无需共享文件系统。
通过MosaicML和R2，用户可以在不同的云提供商之间无缝切换，降低训练成本，避免出口费用。
MosaicML平台与Cloudflare R2的结合为用户提供了最大程度的自主权和控制力，适应组织的需求变化。

🏷️

继续阅读

【Rust日报】2026-06-04 fff：专为 AI Agent 设计的最快文件搜索工具包
fff是一个高性能文件搜索工具包，支持多种AI编程工具，具备快速且精准的搜索能力，核心功能包括内容和路径搜索、频次记忆及Git感知注解。driftwm是实...
VoidZero团队已加入Cloudflare
VoidZero团队已加入Cloudflare，Vite及其相关项目将继续保持开源和中立。Cloudflare承诺投资100万美元支持Vite生态系统的维...
使用本地大型语言模型进行自主编程
本文讨论了如何使用本地大型语言模型（LLM）进行编程，特别是在GitHub转向基于使用量计费后。作者分享了运行本地模型的步骤、配置代理的方法以及推荐的模型...
全球规模最大的加密货币交易所币安宣布停止支持NFT 不再提供任何交易
全球最大加密货币交易所币安宣布停止NFT交易，用户需在2026年7月3日前提取NFT代币。由于NFT市场崩溃，许多代币价值归零，币安将为部分用户提供1US...
LeCun 10亿押注的方向，全球领先视觉大模型团队早已布局
视启未来团队专注于开发隐空间世界模型，推动AI从“看见”向“预见”转变。创始人张磊指出，理解因果关系和物理规律至关重要。团队通过提升物体理解能力，推出全球...
将全球需求转化为收入的新方法
Stripe推出新产品，帮助企业应对跨境支付和合规挑战，提升客户体验和支付转化率。通过本地化支付方式和定价，企业可增加收入，并利用税务合规和反欺诈工具简化全球扩展。

Cloudflare R2和MosaicML实现全球任意计算设备上训练大型语言模型，零切换成本

内容提要

关键要点

标签

继续阅读