小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

系统性能优化涉及延迟与吞吐量的平衡。优化措施可提升其中一项,但不当组合可能导致性能下降。批处理和微批处理提高效率,子任务并行化需谨慎调度。低精度计算和缓存平衡也是关键。整体优化需精心设计,以确保系统性能提升。

系统性能优化

Lei Mao's Log Book
Lei Mao's Log Book · 2026-02-16T08:00:00Z

链式提示系统将任务分解为步骤,路由系统对输入进行分类,并行化系统同时处理任务,协调器动态分解任务,评估器优化器提供反馈。

常见的几种 LLM Agent 架构

陈少文的博客
陈少文的博客 · 2025-12-21T00:00:00Z
更好地构建软件,以更高效地构建软件

我们管理Quip和Slack Canvas的构建管道,解决了构建时间长达60分钟的问题。通过结合现代构建工具Bazel和经典软件工程原则,优化了构建性能,采用缓存和并行化技术,显著提高了构建速度,缩短了开发周期。

更好地构建软件,以更高效地构建软件

Slack Engineering
Slack Engineering · 2025-11-06T16:00:47Z
《Agentic Design Patterns:构建智能系统的实战指南》- 第三章 并行化

并行化设计模式允许多个独立任务同时执行,从而提高智能系统的效率。通过识别工作流中不依赖其他任务的部分,开发者可以显著缩短总执行时间,特别适合需要与外部服务交互的场景。LangChain和Google ADK等框架提供了支持并行执行的机制,助力构建高效的智能应用。

《Agentic Design Patterns:构建智能系统的实战指南》- 第三章 并行化

实时互动网
实时互动网 · 2025-10-20T02:43:36Z
Agent设计模式——第 3 章:并行化

并行化模式通过同时执行多个独立任务,提高Agent系统效率,显著缩短总执行时间。现代框架如LangChain和Google ADK支持并行执行,适用于信息收集和数据处理等场景,优化复杂工作流性能。

Agent设计模式——第 3 章:并行化

XINDOO的博客
XINDOO的博客 · 2025-10-04T15:59:22Z
【Rust日报】2025-08-29 使用纯 Rust 实现 SIMD 加速算法(ChaCha20 / ChaCha12)的经验教训

文章讨论了使用纯 Rust 实现 ChaCha20/ChaCha12 算法的 SIMD 加速经验,强调了并行化和数据块处理的加速思路。作者选择了 std::arch 原始 intrinsic 实现,认为 Rust 在不牺牲安全性的前提下,能够接近汇编性能,并期待 portable_simd 的稳定发布。

【Rust日报】2025-08-29 使用纯 Rust 实现 SIMD 加速算法(ChaCha20 / ChaCha12)的经验教训

Rust.cc
Rust.cc · 2025-08-21T05:37:31Z
让代码飙升330倍:从入门到精通的四种性能优化实践

本文介绍了四种性能优化实践,结合使用可将Python代码性能提升330倍,优化方法包括效率、编译、并行化和流程。

让代码飙升330倍:从入门到精通的四种性能优化实践

豌豆花下猫 | Python猫
豌豆花下猫 | Python猫 · 2025-07-09T00:00:00Z
代理编码建议

本文讨论了代理编码的实践,作者使用Claude Code工具,强调Go语言的简洁性和稳定性。建议使用简单代码,避免复杂性,并重视并行化和重构,以提升效率和可维护性。

代理编码建议

Armin Ronacher's Thoughts and Writings
Armin Ronacher's Thoughts and Writings · 2025-06-12T00:00:00Z
嵌套的 parallelStream():更多并发,性能更差

使用.parallelStream()时,过度并行化会导致性能下降。实验表明,单层并行化比多层并行化更高效,后者增加了开销和不稳定性。建议仅在外层进行并行化,避免嵌套使用。

嵌套的 parallelStream():更多并发,性能更差

DEV Community
DEV Community · 2025-04-15T14:55:30Z

本研究提出了ATTENTION2D方法,旨在解决传统自注意力机制在处理长序列时的计算和内存成本问题。该方法通过查询与键/值维度的并行性,实现了高效的分布与并行化,实验结果显示训练和推理速度提升了5至9.4倍。

ATTENTION2D: A Communication-Efficient Distributed Self-Attention Mechanism

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究提出了一种高效并行化的多目标A*搜索框架,解决了多目标最短路径问题,实验结果显示该框架显著提升了A*算法的性能。

Parallel Multi-Objective A* Search

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-13T00:00:00Z

本研究提出了TianJi系统,通过放宽任务依赖关系,实现异步通信,解决了深度强化学习训练中的并行化不足问题。实验结果表明,TianJi的收敛时间比现有系统快4.37倍,显著提升了训练效率和可扩展性。

Highly Parallelized Reinforcement Learning Training with Relaxed Task Dependencies

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-27T00:00:00Z

本文讨论了通过并行化提高NumPy数组操作速度的方法。尽管NumPy本身已经很快,但使用OpenMP、NumExpr、Joblib和Dask等工具可以进一步加速处理。测试结果表明,NumExpr在速度上表现最佳,从而有效提升大数据集的处理效率。

通过并行化提高NumPy数组操作速度

KDnuggets
KDnuggets · 2025-02-17T14:29:33Z
MapReduce基础知识(第一部分)

Shrijith Venkatrama介绍了MapReduce编程模型,旨在高效处理大规模数据。其核心原则是“分而治之”和“并行化”,通过将计算移至数据源来提高效率。MapReduce被广泛应用于Google和Hadoop项目中,支持快速的数据转换和聚合。

MapReduce基础知识(第一部分)

DEV Community
DEV Community · 2025-01-31T18:02:39Z

本研究提出了一种新架构StagFormer,解决了传统变换器语言模型解码中的顺序依赖问题。该方法通过错位执行实现解码并行化,提升解码速度33%,同时保持生成质量,并探讨了在内存有限情况下的应用潜力。

StagFormer: Temporal Displacement Transformer Decoding for Parallel Execution

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-26T00:00:00Z
有效管理自动化测试套件中不稳定测试的策略

不稳定测试是自动化测试中的常见问题,影响测试结果的可靠性。管理策略包括识别和隔离不稳定测试、提高稳定性、重新运行、优先考虑关键测试、定期重构测试代码及实现并行化。这些方法有助于提升测试的可靠性和效率。

有效管理自动化测试套件中不稳定测试的策略

DEV Community
DEV Community · 2024-12-31T12:47:39Z

本文讲解如何使用SPVM将AI程序打包为单个可执行文件,以便在Raspberry Pi上运行。以MNIST图像识别为例,使用SPVM和SPVM::R编写。步骤包括安装模块、执行程序和生成可执行文件,并提到可通过SPVM::Thread和SPVM::Go实现并行化。

如何使用SPVM为AI程序生成可执行文件?

DEV Community
DEV Community · 2024-10-08T04:59:31Z

本研究重新评估传统RNN,如LSTM和GRU,提出通过消除隐藏状态依赖的新方法。简化版(minLSTMs和minGRUs)减少参数,训练可完全并行化,效率提升175倍,性能与最新序列模型相当。

递归神经网络是我们所需的一切吗?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

本文介绍如何选择最佳模型,包括选择学习算法及其超参数。通过穷举搜索和随机搜索,利用GridSearchCV和RandomizedSearchCV进行模型选择。还讨论了在多种算法和预处理步骤中选择最佳模型的方法,并介绍了通过并行化和特定算法加速模型选择的技巧。

机器学习模型选择

DEV Community
DEV Community · 2024-09-24T18:51:29Z

数字图像处理是转换、增强和解释图像的领域,边缘检测是其中的基础技术之一。通过数学运算识别像素强度的变化,检测图像中的对象和边界。边缘检测对于分割和物体识别等任务至关重要。本项目使用Prewitt算子并行化边缘检测,加快计算速度。

🚀 使用线程和MiniMagick在Ruby中进行边缘检测 🌄

DEV Community
DEV Community · 2024-09-12T01:53:17Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码