郑文峰的博客 ·

tcp缓存引起的日志丢失

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

Logstash从数据源拉取日志时，因TCP插件处理日志过大导致输出量减少和丢失。通过调整最大缓存和错误处理，成功解决了该问题。

🎯

🔎

在使用Logstash的TCP插件时，合理配置最大缓存大小至关重要。默认的最大缓存为64k，如果日志大小超过此限制，可能导致日志丢失。因此，建议根据实际日志大小调整配置，以确保数据的完整性。

在处理日志时，未能有效捕捉和处理错误可能导致问题被忽视。本文提到的Scan方法未处理超长日志错误，导致无法发现日志丢失的根本原因。加强错误处理机制可以提高系统的稳定性和可靠性。

通过逐步排查Logstash的输入输出状态，能够有效定位问题。本文展示了从日志检查到组件配置的系统性排查流程，强调了理解各个组件参数的重要性，这对减少故障发生具有积极作用。

❓

日志大小超过TCP插件的最大缓存限制，导致日志无法接收和丢失。

可以通过添加stdout插件来检查，比较in和out的数量是否相等。

将TCP的最大缓存大小设置为可配置，并在Scan发生错误时打印错误日志。

应关注Logstash日志、管道状态、日志大小及TCP插件的配置。

因为输入量大于输出量，且可能由于日志大小超过TCP插件的处理能力。

maxTokenSize的默认值为64k。

🏷️