💡 原文中文,约11800字,阅读约需28分钟。
📝

内容提要

在一个项目中,使用飞书思维导图导出PDF时层级关系丧失。通过逆向提取纯文本,并利用AI工具Claude Code分析二进制文件,成功提取思维导图的内容和层次关系,输出为JSON和Markdown格式,从而提高了工作效率。

🎯

关键要点

  • 项目依赖飞书思维导图,但导出PDF时层级关系丧失。
  • 通过逆向提取纯文本,目标是保留层级关系,输出为易读格式。
  • 获取二进制文件相对简单,但逆向分析较为复杂。
  • 使用AI工具Claude Code分析二进制文件,尝试提取思维导图内容。
  • Claude Code成功识别文件格式为protobuf,并生成解析程序。
  • 使用blackboxprotobuf库进一步解析二进制文件,提取思维导图结构。
  • 优化脚本以支持输出为markdown和yaml格式,解决了格式问题。
  • 处理较大文件时,blackboxprotobuf速度较慢,需关注未来兼容性。
  • AI时代显著提升工作效率,减少了手动逆向所需时间。
  • 面临的挑战包括如何将复杂信息转为AI可接收格式,以及缩减上下文。
➡️

继续阅读