ScrapBook彻查成果
💡
原文中文,约11500字,阅读约需28分钟。
📝
内容提要
作者使用ScrapBook来收集、整理和发布个人网络资料,通过分库、清除多余节点和网页子目录来加速使用。作者介绍了ScrapBook的数据结构和关键数据约定,使用pax工具复制目录并加载新的目录。作者清除了重建的空仓库中的意外记录,并尝试了不同的解析库。最后,作者完成了一个可用的版本。
🎯
关键要点
- 作者使用ScrapBook收集、整理和发布个人网络资料,已使用8年。
- 通过分库和清除多余节点来加速ScrapBook的使用。
- ScrapBook在everynote流行之前就已成功解决在线网页资料的管理问题。
- 作者通过Python编写辅助脚本,实现自动化差异发布。
- 本地FLOSS仓库搜索变得缓慢,作者决定优化仓库结构。
- 使用脚本分析scrapbook.rdf数据库,清除无效节点和多余网页子目录。
- 建立新的分仓库和对应的发布空间以加速访问。
- ScrapBook的数据结构包括多个目录和XML数据约定。
- 使用pax工具进行目录复制,提升文件迁移效率。
- 清理过程中发现大量无效节点,最终释放了近25GB的空间。
- 作者完成了一个可用的ScrapBook版本,并进行了功能回顾。
➡️