Redis Stack中的新概率数据结构:t-digest

Redis Stack中的新概率数据结构:t-digest

💡 原文英文,约2700词,阅读约需10分钟。
📝

内容提要

Redis Stack引入了t-digest概率数据结构,可以有效估算序列测量的百分位数,支持RedisInsight、查询和搜索、JSON、图表、时间序列等数据模型和处理引擎。t-digest可以让你更容易地获得准确的结果,而且内存占用小,添加和查询数据也很快,可以使用TDIGEST.CREATE、TDIGEST.ADD、TDIGEST.QUANTILE、TDIGEST.BYRANK、TDIGEST.BYREVRANK和TDIGEST.CDF等命令来操作t-digest。

🎯

关键要点

  • Redis Stack引入了t-digest概率数据结构,用于有效估算序列测量的百分位数。
  • t-digest支持RedisInsight、查询和搜索、JSON、图表、时间序列等数据模型和处理引擎。
  • t-digest的内存占用小,添加和查询数据速度快。
  • t-digest可以回答数据流中值的分布问题,如小于某个值的比例和具体的百分位数。
  • t-digest的使用场景包括硬件/软件监控、在线游戏、网络流量监控和预测性维护。
  • 使用t-digest可以更容易地获取统计数据,尽管可能会有微小的相对误差。
  • t-digest的基本命令包括TDIGEST.CREATE、TDIGEST.ADD、TDIGEST.QUANTILE、TDIGEST.BYRANK、TDIGEST.BYREVRANK和TDIGEST.CDF。
  • 可以通过TDIGEST.TRIMMED_MEAN计算指定百分位数之间的平均值。
  • t-digest支持合并多个数据结构,以便计算综合的百分位数。
  • 使用TDIGEST.MIN和TDIGEST.MAX可以获取t-digest中的最小和最大值。
  • t-digest扩展了Redis的概率数据结构,适用于流数据和大数据集的处理。
➡️

继续阅读