Mux Blog - Video technology and more ·

ClickHouse Kafka表引擎的延迟与吞吐量权衡

💡 原文英文，约2600词，阅读约需10分钟。

📝

内容提要

我们在使用ClickHouse作为Mux数据监控仪表板后端时，遇到高流量实时数据摄取的性能瓶颈。尽管CPU利用率为60%，延迟却从100毫秒上升至10秒。通过测量摄取延迟，我们发现优化吞吐量导致了延迟问题。最终，通过调整批处理格式和刷新间隔，成功将延迟降低至2-6秒，达成实时处理目标。

🎯

❓

在高流量实时数据摄取中，ClickHouse的延迟从100毫秒上升至10秒，尽管CPU利用率仅为60%。

通过增加物化视图来直接测量摄取延迟，跟踪消息从Kafka到ClickHouse的处理时间。

优化吞吐量导致了延迟问题，最终需要调整批处理格式和刷新间隔来降低延迟。

通过调整kafka_flush_interval_ms设置和使用批处理格式，成功将延迟降低至2-6秒。

延迟与吞吐量之间存在经典的权衡，优化其中一个可能会导致另一个的下降。

可以使用物化视图来监测插入的行数和延迟，以便及时发现性能问题。

🏷️

深入探讨Lakebase的首个生产部署之一：LangGuard的自主工作流治理引擎
LangGuard是为企业自主AI代理工作流设计的控制基础设施，实时监控和执行政策，确保安全性。它利用Lakebase的无服务器架构，动态调整计算资源，支...
SharpIDE：基于 .NET 与 Godot 引擎的跨平台开源 IDE
SharpIDE是一款开源的跨平台集成开发环境，专为.NET生态系统设计，源代码托管于GitHub，采用MIT许可证。与Visual Studio和Jet...
VS Code的Python Environments扩展 - 2026年4月更新
Python Environments扩展在2026年4月更新，提升了启动性能和可靠性。主要改进包括延迟管理器发现、加快环境解析、缩小默认工作区扫描范围、...
GitHub将Copilot改为基于使用量的计费，因AI编码成本上升
GitHub宣布将Copilot的收费模式改为基于使用量的计费，计划于6月1日生效。新模式将使用信用额度与开发者的实际使用情况挂钩，用户每月将获得一定的A...
为什么人工智能工程需要传统的纪律
许多公司在将人工智能项目从概念验证转向生产时面临挑战。Thoughtworks的Nimisha Asthagiri指出，成功的公司应重新思考技术应用，而非...
Christophe Pettus: Notice of Obsolescence
Yesterday David Steele announced that he is stepping away from pgBackRest. Af...