最近使用Elasticsearch实现画像系统,调研了竞品架构选型,重温了redis原理。Elasticsearch的通讯使用netty,内存分为on heap和off heap,不能回收的部分有node query cache、shard request cache、file data cache、segments cache。持久化分为快照和translog日志。应用方面,使用es解决人群预估、人群包圈选和人包判定问题。优化方面,需要优化mapping,使用线程池和适当的拒绝策略,调整refresh policy等。瓶颈方面,可以使用redis或MongoDB存储人包数据。总结来说,Elasticsearch在实时检索方面表现出色,但实时写会降低检索性能。
本文介绍了字节跳动的OLAP引擎技术和落地经验,重点讲解了广告精准投放场景和人群预估的问题。字节跳动开发了BitEngine方案,通过bitmap64类型和聚合函数实现了高效的交并补计算。该方案在广告业务中取得了显著效果,存储空间和导入时间缩小了3倍,查询性能和CPU使用率明显改善。BitEngine已集成在字节跳动的数据仓库ByteHouse中,为用户提供极速分析体验。未来,BitEngine将继续增强功能以支持广告业务场景。
完成下面两步后,将自动完成登录并继续当前操作。