小红花·文摘

LevelDB通过Bloom Filter优化SST文件查询，利用位数组快速判断key是否存在。Bloom Filter允许一定的误判率，从而节省存储空间。不同变体如Counting、Blocked、Cuckoo和Ribbon Filter各有优缺点，适用于不同场景。选择合适的过滤器需考虑数据的静态或动态特性、误判率要求及性能需求。

Bloom Filter 全家族：Standard → Counting → Cuckoo → Ribbon

土法炼钢兴趣小组的博客 ·

王晓婷探讨了从学术到工业界的转变，分享了在广告反作弊技术中的挑战与创新。通过深度学习和大模型，她优化了京东的反作弊系统，提高了识别能力并降低了误判率。她强调技术与业务的平衡，以及跨领域思考，以应对不断升级的作弊手段。

从校园实验室到京东零售：一位算法工程师的风控实战录

京东科技开发者 ·

准确率从 19% 提升至 95%！文本审核模型优化的三个阶段实践（下）

亚马逊AWS官方博客 ·

准确率从 19% 提升至 95%！文本审核模型优化的三个阶段实践（上）

亚马逊AWS官方博客 ·

在C#中，可以使用BitArray和Hash函数实现布隆过滤器。BloomFilter类使用BitArray表示过滤器的位数组，使用一组Hash函数生成多个哈希值，并在BitArray中设置对应的位。Add方法用于添加元素，Contains方法用于检查元素是否存在。布隆过滤器有一定的误判率，需要根据需求和数据量大小选择合适的过滤器大小和哈希函数个数来控制误判率。

c# 实现布隆过滤器

dotNET跨平台 ·