并行训练与智能系统设计：探索前沿技术与应用 - 小红花·文摘 - 小红花技术领袖俱乐部

沉浸式翻译 immersive translate

ParaRNN：解锁非线性RNN的大规模语言模型的并行训练

ParaRNN：解锁非线性RNN的大规模语言模型的并行训练

Apple Machine Learning Research ·

PatrickStar - 一个通过…实现大规模预训练模型并行训练的框架

PatrickStar - 一个通过…实现大规模预训练模型并行训练的框架

云原生 ·

混合专家模型比你想象的更强大：基于RoE的超并行推理扩展

混合专家模型比你想象的更强大：基于RoE的超并行推理扩展

Apple Machine Learning Research ·

Worktrunk - 一个面向开发者的CLI工具，简化Git工作树的并行工作流...

Worktrunk - 一个面向开发者的CLI工具，简化Git工作树的并行工作流...

云原生 ·

为什么AI并行化将成为2026年最大的挑战之一

为什么AI并行化将成为2026年最大的挑战之一

The New Stack ·

Homebrew 5.0：并行加速、MCP 加持，与 Intel 的最后倒计时 - 肘子的 Swift 周报 #111

Homebrew 5.0：并行加速、MCP 加持，与 Intel 的最后倒计时 - 肘子的 Swift 周报 #111

肘子的Swift记事本 ·

《Agentic Design Patterns：构建智能系统的实战指南》- 第三章并行化

《Agentic Design Patterns：构建智能系统的实战指南》- 第三章并行化

实时互动网 ·

Agent设计模式——第 3 章：并行化

Agent设计模式——第 3 章：并行化

XINDOO的博客 ·

容器使用：一种用于隔离并行编码代理的新工具

容器使用：一种用于隔离并行编码代理的新工具

InfoQ ·

SMP并行执行技术通过数据分片和多线程计算提升复杂查询性能，适用于低并发场景。OpenGaussDB利用该技术优化SQL查询，但在高并发或资源不足时可能导致性能下降。

基于开发者空间OpenGauss数据库SMP并行技术的实现与应用

华为云官方博客 ·

在多核处理器时代，后端工程师需掌握并行编程。Guy L. Steele Jr. 提出应关注独立性而非并行本身，强调“分治”和“结合性”原则，鼓励将问题分解为独立子问题以简化并行设计。Go 语言通过 Goroutine 和 Channel 降低并发编程复杂性，但仍需开发者主动设计并行策略。

Go并行编程的“第一性原理”：Guy Steele 教你如何“不去想”并行

Tony Bai ·

Ruby中的并发与并行

Ruby中的并发与并行

DEV Community ·

本研究扩展了信念修正的迭代并行修正模型，提出了一种利用TeamQueue聚合器的方法，以有效整合信念修正属性，增强理论基础。

通过顺序聚合进行并行信念修正

BriefGPT - AI 论文速递 ·

本研究探讨了大型语言模型（LLMs）在无需硬件的情况下对GPU代码性能进行并行预测的能力。结果表明，经过调优的LLMs在零-shot和few-shot条件下表现出色，能够有效区分计算密集型和带宽密集型的GPU内核，为性能分析和优化提供新思路。

大型语言模型能否预测并行代码性能？

BriefGPT - AI 论文速递 ·

本研究提出了一种新型的协作分布式联邦学习方案，通过将模型分为三部分，实现客户端与服务器的并行训练与聚合，显著降低了计算和通信负担，并提高了模型的准确性。实验结果验证了该方案的优势。

协作分布式联邦学习与并行训练与聚合

BriefGPT - AI 论文速递 ·

本研究提出SlimPipe方法，以解决长上下文大型语言模型训练中的内存压力和效率瓶颈。通过均匀切片和1F1B调度，显著提高模型FLOPs利用率，尤其在处理超过2048K上下文时，保持超过45%的利用率，优于现有方法。

SlimPipe：针对长上下文大型语言模型训练的节省内存且高效的流水线并行技术

BriefGPT - AI 论文速递 ·

EF Core与PostgreSQL中的并行查询：失败原因及解决方法

EF Core与PostgreSQL中的并行查询：失败原因及解决方法

DEV Community ·

C#中的并发与并行编程最佳实践

C#中的并发与并行编程最佳实践

DEV Community ·

并行编程基础

并行编程基础

DEV Community ·

我与微软的旅程：从并行端口到Azure与人工智能

我与微软的旅程：从并行端口到Azure与人工智能

DEV Community ·