极道 ·

Petals：在家中就能运行P2P大语言模型

💡 原文中文，约1700字，阅读约需4分钟。

📝

内容提要

Petals是一个社区运行的系统，可以协作运行大型语言模型，比Offloading更快。Petals只在服务器之间发送少量数据，而Offloading会将数百GB的NN权重复制到GPU VRAM上。您可以使用任何微调和采样方法，通过模型执行自定义路径，或查看其隐藏状态。Petals可以使用多种生成文本的方法，并根据自己的任务对它们进行微调。

🎯

关键要点

Petals是一个社区运行的系统，允许用户共享GPU以协作运行大型语言模型。
Petals以协作方式运行Llama和BLOOM等模型，加载模型的一小部分进行推理或微调。
Llama 2的单批推理速度可达6步/秒，BLOOM-176B约为1步/秒，比Offloading快10倍。
并行推理速度可达数百个token/秒，适合构建聊天机器人和其他交互式应用程序。
Offloading是另一种运行大型语言模型的方法，但速度较慢，需将大量NN权重复制到GPU内存。
Petals通过互联网通信，仅在服务器之间发送少量数据（NN激活），因此更快。
Petals提供API的舒适性和PyTorch的灵活性，支持多种微调和采样方法。
用户可以通过简单的命令在GPU上托管Stable Beluga 2等模型，并进行文本生成和微调。

🏷️

继续阅读

Asana称其新的AI“首席助理”将您的Slack混乱转化为可追踪的工作
Asana在伦敦的工作创新峰会上推出了名为Dash的AI助手，旨在提升工作管理平台的效率。Dash能够从会议、Slack和邮件中捕捉待办事项，并将其转化为...
Nvidia最新模型现已上线
Nvidia发布了Nemotron 3 Ultra模型，拥有5500亿参数，支持高达100万标记的上下文窗口。该模型速度显著提升，能节省用户30%的成本。...
国家科学基金会续资麻省理工学院主导的人工智能与物理学研究所，扩展新的发现模式
麻省理工学院主导的人工智能与基础相互作用研究所（IAIFI）获得国家科学基金会续资，年资助额从400万美元增至498万美元。IAIFI致力于将人工智能与物...
Kaggle 使 AI 基准创建变得轻而易举
Kaggle Benchmarks推出本地开发功能，允许开发者在本地环境中创建和验证评估任务。该功能支持使用AI编码代理通过自然语言构建任务，旨在加速AI...
帮助出版商和创作者在搜索中突出展示他们的作品的新个人资料
谷歌推出搜索个人资料功能，帮助出版商和创作者展示内容，用户可通过移动设备关注创作者以获取更新。符合条件的出版商和创作者可以自定义个人资料，并可能触发知识面...
行业领袖分享初创企业生成媒体的新视角
生成媒体为初创企业提供创意优势，未来将实现无需编码或编辑的“氛围设计”。视频将取代静态内容，AI生成的视频需融入人类视角以增强共鸣。传统界面可能消失，脑机...

Petals：在家中就能运行P2P大语言模型

内容提要

关键要点

标签

继续阅读