VLDB 2023 | CDSBen: 字节跳动 veDB 数据库存储系统性能测试模型
💡
原文中文,约3900字,阅读约需10分钟。
📝
内容提要
随着业务增长和云原生技术的发展,云原生分布式数据库产品不断涌现。字节跳动提出了CDSBen模型,利用机器学习预测存储层的IO pattern,实现真实的benchmark。CDSBen包括IOPS序列预测模型和联合分布预测模型,通过训练模型和改造后的YCSB工具进行基准测试。CDSBen的优势在于准确、灵活和易用。实验结果显示,CDSBen生成的读写请求性能更贴近真实业务流量。
🎯
关键要点
-
随着云原生技术的发展,云原生分布式数据库产品不断涌现。
-
字节跳动提出CDSBen模型,利用机器学习预测存储层的IO pattern,实现真实的benchmark。
-
CDSBen包括IOPS序列预测模型和联合分布预测模型,通过训练模型和改造后的YCSB工具进行基准测试。
-
CDSBen的优势在于准确、灵活和易用,生成的读写请求性能更贴近真实业务流量。
-
veDB是字节跳动基于计算-存储分离架构实现的云原生分布式数据库,服务于OLTP场景。
-
veDB的目标包括高弹性、高性价比、高易用性和高可靠性。
-
veDB的存储层Benchmark存在挑战,传统的benchmark模型无法有效评估专用存储系统。
-
CDSBen模型通过匹配数据库事务执行pattern与存储系统的IO pattern,解决了benchmark问题。
-
CDSBen的工作流程包括特征提取、模型训练和负荷生成。
-
CDSBen的模型训练开销较小,且可以生成贴近真实情况的读写请求。
-
CDSBen在实验中显示出与真实业务流量的高匹配度,提升了存储层的性能测试准确性。
➡️