使用火山引擎 APMPlus 解决抖音Top 1 Java 崩溃的通用优化方案

背景近3个月,抖音 Android 版面临一个多次触发线上报警的崩溃问题,全量版本和灰度版本的异常数据激增,该问题不仅容易触发报警,更成为了 Java Top 1 崩溃问题,带来巨大困扰,急需攻坚解决。本文展现了具体的分析过程、优化思路和解决方案,同时提供了已集成该方案的实用工具。初步分析多维特征我们以某发版期间数据为例进行分析:机型方面:比较分散,有聚集部分samsung sm-s9180 占比...

抖音Android版近3个月面临多次崩溃问题,分析发现是Activity stop时传输的Bundle数据超过Binder驱动限制的大小导致的。通过优化方案,将超过阈值的Bundle数据缩小并使用ID替代,再在恢复时还原。该方案已在抖音全量上线,并集成到APMPlus应用性能监控工具中。该工具提供全链路的应用性能监控服务,帮助企业提升异常问题排查与解决的效率。

原文中文,约14200字,阅读约需34分钟。发表于:
阅读原文