morling.dev -- Blog ·

"你不需要Kafka，只需使用Postgres"被认为是有害的

💡 原文英文，约2500词，阅读约需9分钟。

📝

内容提要

Postgres和Kafka是为不同目的设计的工具，不能简单替代。虽然Postgres在某些情况下有效，但Kafka在事件流处理、可扩展性和故障容忍方面具有独特优势。选择合适的工具至关重要，通常同时使用两者更为合理。

🎯

关键要点

Postgres和Kafka是为不同目的设计的工具，不能简单替代。
选择合适的工具至关重要，通常同时使用Postgres和Kafka更为合理。
Postgres适合某些用例，但Kafka在事件流处理、可扩展性和故障容忍方面具有独特优势。
使用Postgres作为作业队列可能会导致MVCC膨胀和WAL堆积等问题。
Kafka支持多种用例，如微服务通信、数据交换和实时流处理。
Kafka的日志语义、故障容忍性和高可用性使其在事件流应用中更具吸引力。
Postgres在处理低延迟和高并发时面临挑战，尤其是在事件流场景中。
Kafka拥有丰富的连接器生态系统，便于数据集成，而Postgres缺乏类似的支持。
使用Postgres作为事件流平台的提议在数据量较大时并不合理，可能导致不必要的复杂性。
应为当前和未来的负载构建系统，Kafka在可扩展性方面表现更佳。
在许多情况下，使用Postgres管理内部状态，使用Kafka交换数据和事件是合理的。
通过变更数据捕获（CDC）模式，可以保持Postgres和Kafka之间的一致性。
运行Kafka并不复杂，特别是对于小数据集，使用托管服务可以简化操作。

🔎

延伸解读

工具选择的重要性

Postgres和Kafka各自针对不同的应用场景设计，选择合适的工具至关重要。Postgres适合管理关系型数据，而Kafka则在实时事件流处理方面表现优越。了解各自的优势和局限性，可以帮助开发者在系统设计时做出更明智的决策。

Postgres作为作业队列的风险

使用Postgres作为作业队列可能导致MVCC膨胀和WAL堆积等问题，尤其是在长时间运行的事务中。开发者应进行充分的性能测试，以确保系统在高负载下的稳定性，避免潜在的性能瓶颈。

可扩展性与未来需求

在设计系统时，应考虑当前和未来的负载需求。虽然Postgres在小规模数据处理上可行，但随着数据量的增加，可能会面临扩展困难。Kafka的设计初衷是支持高可扩展性，适合快速增长的业务需求。

集成与连接器生态系统

Kafka拥有丰富的连接器生态系统，便于数据集成和流转，而Postgres在这方面的支持较弱。对于需要频繁数据交换的应用场景，Kafka的优势显著，开发者应考虑这一点以简化数据管道的构建。

❓

延伸问答

Postgres和Kafka的主要区别是什么？

Postgres是关系型数据库，适合管理和查询数据，而Kafka是事件流平台，专注于实时数据处理和可扩展性。

为什么不建议将Postgres用作事件流平台？

Postgres在处理高并发和低延迟时面临挑战，且缺乏Kafka的故障容忍性和高可用性。

使用Postgres作为作业队列可能会遇到什么问题？

可能导致MVCC膨胀和WAL堆积等问题，影响性能和稳定性。

Kafka在事件流处理方面有哪些独特优势？

Kafka支持高可用性、故障容忍、日志语义和丰富的连接器生态系统，适合多种实时数据处理用例。

在什么情况下同时使用Postgres和Kafka更为合理？

在需要管理内部状态的同时，使用Kafka进行数据和事件交换时，结合两者的优势是合理的。

如何保持Postgres和Kafka之间的一致性？

可以通过变更数据捕获（CDC）模式，使用工具如Debezium来保持两者之间的一致性。

🏷️