💡
原文中文,约11800字,阅读约需28分钟。
📝
内容提要
在一个项目中,使用飞书思维导图导出PDF时层级关系丧失。通过逆向提取纯文本,并利用AI工具Claude Code分析二进制文件,成功提取思维导图的内容和层次关系,输出为JSON和Markdown格式,从而提高了工作效率。
🎯
关键要点
- 项目依赖飞书思维导图,但导出PDF时层级关系丧失。
- 通过逆向提取纯文本,目标是保留层级关系,输出为易读格式。
- 获取二进制文件相对简单,但逆向分析较为复杂。
- 使用AI工具Claude Code分析二进制文件,尝试提取思维导图内容。
- Claude Code成功识别文件格式为protobuf,并生成解析程序。
- 使用blackboxprotobuf库进一步解析二进制文件,提取思维导图结构。
- 优化脚本以支持输出为markdown和yaml格式,解决了格式问题。
- 处理较大文件时,blackboxprotobuf速度较慢,需关注未来兼容性。
- AI时代显著提升工作效率,减少了手动逆向所需时间。
- 面临的挑战包括如何将复杂信息转为AI可接收格式,以及缩减上下文。
➡️