通过文本分类检测中的代码混淆

💡 原文中文,约10400字,阅读约需25分钟。
📝

内容提要

本文介绍了Android APK中的混淆技术及其对安全的影响,提出了一种基于文本分类的混淆检测方法,具有高准确率和可扩展性。然而,该方法需要更多时间来确定APK是否被混淆,无法应用于控制流混淆检测。建议在类级别进行混淆检测,已在生产环境中实施。

🎯

关键要点

  • 混淆技术用于保护Android APK中的代码,使其更难理解和逆向工程。

  • 混淆的主要目标是阻碍未经授权的访问,保护知识产权。

  • 常用的混淆技术包括代码混淆、字符串加密和控制流混淆。

  • 混淆技术增加了安全研究的难度,使恶意软件更难以识别。

  • Liansecurity开发了一种名为'Incinerator'的混淆检测工具,基于文本分类方法,准确率达到98%。

  • AndrODet是当前最先进的混淆检测系统,但存在一些局限性,如无法处理Unicode编码和依赖库的影响。

  • 我们的方法主要解决标识符重命名的识别问题,并可扩展到字符串加密。

  • 通过深度学习的文本分类方法,我们的模型在混淆检测中表现出色,接近100%的准确率。

  • 未来的研究将专注于控制流混淆的检测,并改进模型的效率。

  • 建议在类级别进行混淆检测,以提高准确率,并已在生产环境中实施。

➡️

继续阅读