VLDB 2023 | CDSBen: 字节跳动 veDB 数据库存储系统性能测试模型

💡 原文中文,约3900字,阅读约需10分钟。
📝

内容提要

随着业务增长和云原生技术的发展,云原生分布式数据库产品不断涌现。字节跳动提出了CDSBen模型,利用机器学习预测存储层的IO pattern,实现真实的benchmark。CDSBen包括IOPS序列预测模型和联合分布预测模型,通过训练模型和改造后的YCSB工具进行基准测试。CDSBen的优势在于准确、灵活和易用。实验结果显示,CDSBen生成的读写请求性能更贴近真实业务流量。

🎯

关键要点

  • 随着云原生技术的发展,云原生分布式数据库产品不断涌现。

  • 字节跳动提出CDSBen模型,利用机器学习预测存储层的IO pattern,实现真实的benchmark。

  • CDSBen包括IOPS序列预测模型和联合分布预测模型,通过训练模型和改造后的YCSB工具进行基准测试。

  • CDSBen的优势在于准确、灵活和易用,生成的读写请求性能更贴近真实业务流量。

  • veDB是字节跳动基于计算-存储分离架构实现的云原生分布式数据库,服务于OLTP场景。

  • veDB的目标包括高弹性、高性价比、高易用性和高可靠性。

  • veDB的存储层Benchmark存在挑战,传统的benchmark模型无法有效评估专用存储系统。

  • CDSBen模型通过匹配数据库事务执行pattern与存储系统的IO pattern,解决了benchmark问题。

  • CDSBen的工作流程包括特征提取、模型训练和负荷生成。

  • CDSBen的模型训练开销较小,且可以生成贴近真实情况的读写请求。

  • CDSBen在实验中显示出与真实业务流量的高匹配度,提升了存储层的性能测试准确性。

➡️

继续阅读