京东科技开发者 ·

工程师之夜系列分享第三十九篇：Kafka、RocketMQ、JMQ 存储架构深度对比

💡 原文中文，约7400字，阅读约需18分钟。

📝

内容提要

本文比较了三款主流消息队列（Kafka、RocketMQ、JMQ），分析了它们的存储架构、数据组织和索引设计。Kafka以高吞吐的分区日志流为核心，RocketMQ通过分离式设计优化数据存储与索引查询，JMQ则结合两者优点以满足京东内部需求。文章详细探讨了各自的设计优势和适用场景。

🎯

🔎

消息队列的存储架构直接影响其可靠性、吞吐量和延迟性能。Kafka的分区日志流设计虽然支持高吞吐量，但存在单点故障的风险；RocketMQ通过分离式设计优化了数据存储与索引查询，适合复杂部署；而JMQ结合两者优点，特别在高并发场景下表现优异。选择合适的存储架构需根据具体业务需求进行评估。

JMQ在设计上融合了Kafka和RocketMQ的优点，特别适合京东内部的高并发应用。其使用DirectBuffer作为缓存，避免了传统写操作的系统调用开销，提升了性能。此外，定长稠密索引设计使得消息查找过程更为高效，适合微服务架构下的高频消费场景。

在选择消息队列时，需考虑存储架构、性能需求及业务场景。Kafka适合高吞吐量需求，但需注意单点故障；RocketMQ在复杂部署中表现稳定；而JMQ则在高并发写入和同步性能上具有优势。根据具体的业务需求和技术环境，合理选择消息队列将有助于提升系统整体性能。

❓

Kafka的核心存储模型是分区日志流，数据以主题和分区的形式组织，确保消息的有序性。

RocketMQ采用分离式设计，使用CommitLog、ConsumeQueue和IndexFile三层结构，优化了数据存储与索引查询。

JMQ结合了Kafka的分区日志和RocketMQ的索引设计，优化了消息存储和查询性能，适应京东内部需求。

Kafka的分区设计虽然提高了性能，但存在单点故障问题，可能影响系统的可靠性。

ConsumeQueue通过存储消息的物理地址、偏移量和长度，提供快速查询，避免了遍历CommitLog的低效。

JMQ在高并发场景下表现优异，采用PartitionGroup设计支持高并发写入，适合京东内部应用。

🏷️