开源Markdown提取工具 - 墨探

💡 原文中文,约900字,阅读约需3分钟。
📝

内容提要

Omni Article Markdown 是一个脚本,用于将网页文章转换为 Markdown 格式,解决了不同网站 HTML 结构多样性带来的内容提取问题。支持的网站包括掘金、Medium 和公众号,其他网站需手动保存。使用前需确保 Python 环境可用并安装依赖,源代码在 GitHub 上开放。

🎯

关键要点

  • Omni Article Markdown 是一个将网页文章转换为 Markdown 格式的脚本。
  • 该脚本旨在解决不同网站 HTML 结构多样性带来的内容提取问题。
  • 支持的网站包括掘金、Medium、Freedium(需先保存至本地)、公众号、简书、知乎专栏(需先保存至本地)、今日头条(需先保存至本地)。
  • 其他网站尚未适配,但理论上可以转换,需手动保存为 HTML 文件。
  • 使用前需确保 Python 环境可用并安装必要依赖。
  • 使用命令行参数指定目标网页 URL 或本地 HTML 文件路径,并可选择保存路径。
  • 源代码在 GitHub 上开放。

延伸问答

Omni Article Markdown 是什么?

Omni Article Markdown 是一个脚本,用于将网页文章转换为 Markdown 格式。

这个脚本支持哪些网站?

支持的网站包括掘金、Medium、Freedium、公众号、简书、知乎专栏和今日头条。

如何使用 Omni Article Markdown?

使用前需确保 Python 环境可用并安装依赖,然后通过命令行指定目标网页 URL 或本地 HTML 文件路径。

如果网站不支持直接抓取,我该怎么办?

对于不支持直接抓取的网站,需要手动保存为 HTML 文件后再使用该工具进行转换。

如何安装 Omni Article Markdown 的依赖?

可以通过命令 'pip install -r requirements.txt' 来安装必要的依赖。

Omni Article Markdown 的源代码在哪里可以找到?

源代码开放在 GitHub 上。

➡️

继续阅读