陈少文的博客 ·

高频 IO 的 POD 并不适合设置 Limit

💡 原文中文，约2000字，阅读约需5分钟。

📝

内容提要

基于Kubernetes的Elasticsearch频繁重启，导致服务几乎不可用。内存使用持续增长，超过限制后导致异常退出。系统内核版本、节点负载都正常。大量的Cache使用导致内存压力。解决方案是重启应用，推荐修改ECK的配置值来触发重启。

🎯

关键要点

基于Kubernetes的Elasticsearch频繁重启，导致服务几乎不可用。
Pod内存使用持续增长，接近限制后触发异常退出，错误日志显示Elasticsearch意外退出。
Elasticsearch Pod内存限制为64GB，JVM内存限制为32GB。
运行环境检测显示系统内核版本和集群版本正常，节点负载低。
大量Cache使用导致内存压力，触发容器Memory OOM。
Cache是操作系统用于缓存最近访问过的文件数据的一部分内存，Elasticsearch的RSS使用量维持在32GB。
直接清理Cache会影响其他应用，且清理时间较长。
推荐重启应用以释放Cache，重启方式包括删除Pod、重启StatefulSet和ECK Operator重启。
建议修改ECK的Request配置值来触发重启，避免新Pod被识别为新的Elasticsearch Node。

❓

延伸问答

为什么基于Kubernetes的Elasticsearch会频繁重启？

Elasticsearch频繁重启是因为Pod内存使用持续增长，接近限制后触发异常退出。

Elasticsearch Pod的内存限制是多少？

Elasticsearch Pod的内存限制为64GB，JVM内存限制为32GB。

如何解决Elasticsearch Pod的内存压力问题？

推荐重启应用以释放Cache，重启方式包括删除Pod、重启StatefulSet和ECK Operator重启。

Cache对Elasticsearch的内存使用有什么影响？

大量Cache使用导致内存压力，触发容器Memory OOM，影响Elasticsearch的稳定性。

直接清理Cache有什么问题？

直接清理Cache会影响其他应用，并且清理时间较长，可能导致训练任务的缓存失效。

如何修改ECK配置以避免新Pod被识别为新的Elasticsearch Node？

建议修改ECK的Request配置值来触发重启应用，以避免新Pod被识别为新的Elasticsearch Node。

➡️

继续阅读

考古学家的副驾驶
本文探讨了如何利用AI和Docker现代化一个20年的Java 1.5代码库。通过法医代码审计，识别出代码的结构性问题，并在不改变代码的前提下，成功在Do...
三星Galaxy Z Flip 8在发布活动前一周泄露
三星即将发布的Galaxy Z Flip 8将搭载Exynos 2600处理器，外观与Z Flip 7相似，支持45W有线充电，并提供新颜色选项。预计将在7月22日发布。
VCard疑似跑路
VCard虚拟卡疑似跑路，建议用户及时提取余额并转为USDT，以减少损失。使用虚拟卡时应保持警惕，避免存入大量资金。
一加在美国从未有过机会
OnePlus宣布退出美国市场，原因是与运营商的合作不顺，特别是失去与T-Mobile的合作后销量大幅下滑。尽管手机性能提升，但在美国市场依赖运营商补贴的...
Claude现在可以为您使用1Password凭证
1Password推出了Claude的新浏览器集成功能，允许Anthropic的AI访问存储的安全凭证，如用户名和密码。用户可以授权Claude完成多步骤...
让你在人工智能领域领先的10个YouTube频道
本文介绍了2026年最受欢迎的十个YouTube频道，专为数据科学家和人工智能工程师设计，分为四类：研究与论文解析、实用AI构建者、核心概念教育者和行业分...