💡
原文中文,约1700字,阅读约需4分钟。
📝
内容提要
本文介绍了一种新的统计唯一元素的思路,采用了采样的方式。通过将一半的元素放入哈希表中保存,并增加随机率来降低内存占用。算法实现简单,思路开阔。
🎯
关键要点
- 介绍了一种新的统计唯一元素的思路,采用采样方式。
- 常见的统计方法包括元素去重、哈希表去重计数和数组排序。
- 如果允许损失精度,可以使用较低的空间占用来统计。
- 利用布隆过滤器是一种常见的思路,但本文提出了全新的思路。
- 采样的思路类似于统计湖泊中鱼的数量,通过钓鱼来估算总数。
- 提出了一种新的算法,通过将一半的元素放入哈希表中来降低空间复杂度。
- 元素在数组中的出现次数会影响其放入哈希表的概率,可能影响计算的公平性。
- 通过在随机之前删除元素,可以解决概率不公平的问题。
- 可以通过增加随机率进一步降低内存占用。
- 动态调整随机率,使其随着数组长度的增加而增加。
- 整个算法实现简单,思路开阔,提供了新的视野。
➡️