一种计数算法

一种计数算法

💡 原文中文,约1700字,阅读约需4分钟。
📝

内容提要

本文介绍了一种新的统计唯一元素的思路,采用了采样的方式。通过将一半的元素放入哈希表中保存,并增加随机率来降低内存占用。算法实现简单,思路开阔。

🎯

关键要点

  • 介绍了一种新的统计唯一元素的思路,采用采样方式。
  • 常见的统计方法包括元素去重、哈希表去重计数和数组排序。
  • 如果允许损失精度,可以使用较低的空间占用来统计。
  • 利用布隆过滤器是一种常见的思路,但本文提出了全新的思路。
  • 采样的思路类似于统计湖泊中鱼的数量,通过钓鱼来估算总数。
  • 提出了一种新的算法,通过将一半的元素放入哈希表中来降低空间复杂度。
  • 元素在数组中的出现次数会影响其放入哈希表的概率,可能影响计算的公平性。
  • 通过在随机之前删除元素,可以解决概率不公平的问题。
  • 可以通过增加随机率进一步降低内存占用。
  • 动态调整随机率,使其随着数组长度的增加而增加。
  • 整个算法实现简单,思路开阔,提供了新的视野。
➡️

继续阅读