小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
搜索速度提升3倍:使用Instructed-Retriever-1的并行测试时间扩展

Databricks发布了Agent Bricks知识助手的重大更新,显著提升了回答生成速度和搜索效率,搜索时间减少超过3倍,回答生成时间减少2倍。新模型Instructed-Retriever-1通过并行处理提高了检索质量和速度,支持查询生成和重排序,用户反馈显示使用体验显著改善。

搜索速度提升3倍:使用Instructed-Retriever-1的并行测试时间扩展

Databricks
Databricks · 2026-06-04T13:31:40Z
自适应并行推理:高效推理扩展的新范式

自适应并行推理(APR)是一种新兴的推理模型,能够动态决定何时并行化和分解任务。与传统顺序推理相比,APR通过并行处理多个线程,提高了推理效率,降低了延迟。研究表明,APR在复杂任务中表现出更高的准确性和更低的计算成本,但仍需解决训练稳定性和硬件适应性等问题。

自适应并行推理:高效推理扩展的新范式

The Berkeley Artificial Intelligence Research Blog
The Berkeley Artificial Intelligence Research Blog · 2026-05-08T09:00:00Z
开源Conducty:基于Obsidian知识库实现ClaudeCode并行计划与持续学习

Conducty是一个开源工具,利用Obsidian知识库帮助AI进行项目管理和持续学习。它通过结构化文档系统解决AI记忆不足的问题,形成高效的开发流程,包括规划、执行、验证和改进。Conducty的循环周期确保每次计划都能积累经验,提升AI的协作能力,实现更精准的项目管理。

开源Conducty:基于Obsidian知识库实现ClaudeCode并行计划与持续学习

极道
极道 · 2026-04-28T00:00:00Z

本文讨论了大规模模型训练中的并行化技术,特别是671B MoE模型的训练挑战。随着模型规模的增加,单卡显存不足以支持训练,因此需要采用数据并行、张量并行和流水线并行等多种策略。文章分析了显存消耗、通信成本及不同并行策略的优缺点,并强调了优化通信与计算重叠的重要性。最后,提出了针对不同规模模型的并行配置建议。

【大模型基础设施工程】06:3D 并行深度——数据 / 张量 / 流水 / 序列 / ZeRO

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
为并行代理重新设计Claude Code桌面应用

新桌面应用程序为开发者提供多会话管理、拖放布局、集成终端和文件编辑器等功能,提升了性能和用户体验。用户可以并行运行多个会话,快速切换和管理项目,应用内工具整合使代码审查和发布更加高效,支持自定义视图模式和快捷键,适用于不同工作方式。该应用现已向所有Claude Code用户开放。

为并行代理重新设计Claude Code桌面应用

Claude
Claude · 2026-04-14T00:00:00Z
PatrickStar - 一个通过…实现大规模预训练模型并行训练的框架

PatrickStar是一个基于PyTorch的预训练模型并行训练框架,采用动态内存管理和异构训练策略,降低GPU内存使用,支持大模型训练,特别适合硬件受限环境下的预训练和大规模微调。

PatrickStar - 一个通过…实现大规模预训练模型并行训练的框架

云原生
云原生 · 2026-01-12T10:33:13Z
并发、并行与异步

并发、并行和异步是处理任务的三种不同概念。并发是逻辑上同时处理多个任务,适用于单核;并行是物理上同时执行多个任务,需要多核支持;异步是一种非阻塞的编程模式,旨在提高I/O操作效率。

并发、并行与异步

dotNET跨平台
dotNET跨平台 · 2026-01-12T01:49:40Z
MoE比你想象的更强大:基于RoE的超并行推理扩展

本文介绍了一种名为RoE的超并行推理框架,旨在提升大语言模型(LLM)在标记级别的预测质量。RoE通过动态组合多个专家模型,利用受控随机性为每个标记采样多个专家,从而实现更准确的预测。此外,该方法在计算效率上进行了优化,使得7B MoE模型的性能可与10.5B MoE模型相媲美,同时减少了30%的计算需求。

MoE比你想象的更强大:基于RoE的超并行推理扩展

Apple Machine Learning Research
Apple Machine Learning Research · 2026-01-12T00:00:00Z
Worktrunk - 一个面向开发者的CLI工具,简化Git工作树的并行工作流...

Worktrunk是一个友好的CLI工具,简化Git工作树操作,支持并行工作流和自动化。它提供直观的命令用于创建、切换、合并和删除工作树,适合多任务开发,并支持跨平台安装和文档,便于团队协作和CI环境使用。

Worktrunk - 一个面向开发者的CLI工具,简化Git工作树的并行工作流...

云原生
云原生 · 2026-01-05T08:41:52Z
为什么AI并行化将成为2026年最大的挑战之一

在加州淘金热期间,工具销售商获益最多。Coder CEO Rob Whiteley认为,AI浪潮中,Coder将成为“铲子和镐”的公司。他担心企业未能投资员工的AI技能,导致技术差距加大。为此,Coder推出了开源AI编码代理多路复用器Mux,帮助开发者管理多个AI代理。

为什么AI并行化将成为2026年最大的挑战之一

The New Stack
The New Stack · 2025-12-16T22:00:48Z
Homebrew 5.0:并行加速、MCP 加持,与 Intel 的最后倒计时 - 肘子的 Swift 周报 #111

Homebrew 发布 5.0 版本,新增并行下载和 ARM 设备支持,引入 AI Agent 自动操作功能。Intel Mac 将于 2026 年降级为 Tier 3,2027 年可能停止支持,标志着 Intel 架构逐渐退出,期待未来创新设计。

Homebrew 5.0:并行加速、MCP 加持,与 Intel 的最后倒计时 - 肘子的 Swift 周报 #111

肘子的Swift记事本
肘子的Swift记事本 · 2025-11-17T14:00:00Z

本文介绍了JDK 24和25中的Gatherers,重点讨论了映射、过滤、内部可变状态管理、流的中断、资源泄漏和竞争条件的避免,并探讨了并行Gatherers的使用,以帮助读者高效编写Gatherers。

深入探讨Gatherers - JEP咖啡馆 #24

insidejava
insidejava · 2025-11-14T00:00:00Z
《Agentic Design Patterns:构建智能系统的实战指南》- 第三章 并行化

并行化设计模式允许多个独立任务同时执行,从而提高智能系统的效率。通过识别工作流中不依赖其他任务的部分,开发者可以显著缩短总执行时间,特别适合需要与外部服务交互的场景。LangChain和Google ADK等框架提供了支持并行执行的机制,助力构建高效的智能应用。

《Agentic Design Patterns:构建智能系统的实战指南》- 第三章 并行化

实时互动网
实时互动网 · 2025-10-20T02:43:36Z
并发与并行:它们有什么区别,为什么你应该关心?

在软件工程中,并发和并行的理解与区分对高效系统设计至关重要。并发是指在重叠时间内管理多个任务,而并行是同时执行多个任务。并发优化响应性和资源利用,並行则提升计算速度。掌握这两者的应用能显著提高系统性能。

并发与并行:它们有什么区别,为什么你应该关心?

freeCodeCamp.org
freeCodeCamp.org · 2025-10-17T15:08:36Z
Agent设计模式——第 3 章:并行化

并行化模式通过同时执行多个独立任务,提高Agent系统效率,显著缩短总执行时间。现代框架如LangChain和Google ADK支持并行执行,适用于信息收集和数据处理等场景,优化复杂工作流性能。

Agent设计模式——第 3 章:并行化

XINDOO的博客
XINDOO的博客 · 2025-10-04T15:59:22Z
容器使用:一种用于隔离并行编码代理的新工具

Dagger团队推出了开源工具Container Use,为AI编码代理提供独立的容器化沙箱和Git工作树,支持并行无冲突的工作流程。开发者可以安全地运行多个代理,避免相互干扰。该工具简化了环境创建,支持调试和终端访问,提升开发效率。尽管仍在早期开发阶段,其目标是改善传统代理工作流程,增强安全性和可控性。

容器使用:一种用于隔离并行编码代理的新工具

InfoQ
InfoQ · 2025-08-21T12:00:00Z

SMP并行执行技术通过数据分片和多线程计算提升复杂查询性能,适用于低并发场景。OpenGaussDB利用该技术优化SQL查询,但在高并发或资源不足时可能导致性能下降。

基于开发者空间OpenGauss数据库SMP并行技术的实现与应用

华为云官方博客
华为云官方博客 · 2025-08-14T02:50:12Z

本文讨论了并行排序的优化,重点介绍了排序网络和双调排序的理论与实现。通过将排序任务拆分为独立的并行单元,充分利用多核CPU和GPU的计算能力。分析了排序网络的基本概念及其在并行排序中的应用,特别是双调排序在GPU上的高效实现,并比较了不同排序算法的性能和适用场景,强调选择合适算法的重要性。

并行排序:从归并网络到 GPU 双调排序

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2025-07-15T00:00:00Z

在多核处理器时代,后端工程师需掌握并行编程。Guy L. Steele Jr. 提出应关注独立性而非并行本身,强调“分治”和“结合性”原则,鼓励将问题分解为独立子问题以简化并行设计。Go 语言通过 Goroutine 和 Channel 降低并发编程复杂性,但仍需开发者主动设计并行策略。

Go并行编程的“第一性原理”:Guy Steele 教你如何“不去想”并行

Tony Bai
Tony Bai · 2025-06-29T08:47:23Z
Python 线程池与多进程

在理解多线程和多进程之前,需要明确并发、并行和异步任务的区别。并发是指在多个任务间切换,类似于一个机械师在多辆车间工作;并行则是多个机械师同时工作;异步任务允许在等待时进行其他操作。Python的全局解释器锁(GIL)限制了线程的并行性,因此多线程适合I/O密集型任务,而多进程适合CPU密集型任务。可以通过ThreadPoolExecutor和ProcessPoolExecutor有效管理这两种任务。

Python 线程池与多进程

The New Stack
The New Stack · 2025-06-16T20:00:29Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码