本文介绍了如何使用 curl、w3m 和 awk 从 HTML 表格中提取数据。主要步骤包括:将 HTML 转换为标准 XHTML、提取目标表格、渲染为格式化文本、按固定宽度提取所需列,最终提取“名称”列的公司名。需注意安装相关工具和调整列宽。
完成下面两步后,将自动完成登录并继续当前操作。