划词翻译、OCR 文字提取:我用 AutoHotKey 给自己写了一个小工具

💡 原文中文,约10700字,阅读约需26分钟。
📝

内容提要

本文介绍了作者如何利用 AutoHotKey (AHK) 脚本和大模型 API 在 Windows 上实现翻译和文字识别功能,模仿 Mac 上的翻译软件 Bob,解决了现有工具响应慢和质量差的问题,并分享了代码示例和技巧。

🎯

关键要点

  • 作者利用 AutoHotKey (AHK) 脚本和大模型 API 在 Windows 上实现翻译和文字识别功能。
  • 模仿 Mac 上的翻译软件 Bob,解决了现有工具响应慢和质量差的问题。
  • 使用 PowerToys 和 AHK 热键实现翻译和文字识别,但效果不佳。
  • 找到 STranslate 工具,但仍希望通过自定义脚本提升功能。
  • 使用 AHK 脚本和 AI 生成代码实现翻译和识别功能,过程有趣。
  • 准备工作包括安装 AHK、JSON 库和 GDIP 库。
  • 设置热键以实现翻译和文字识别功能,使用剪贴板获取内容。
  • 发送请求获取翻译和识别结果,处理不同 API 的请求格式。
  • 处理翻译结果的编码问题,将结果从 ISO-8859-1 转为 UTF-8。
  • 显示结果的方法包括 ToolTip 和 msgbox,方便用户查看。
  • 脚本可根据需要修改或添加功能,提升使用体验。
  • 提供完整的 AHK 代码供参考,方便读者学习和使用。

延伸问答

如何使用 AutoHotKey 实现翻译和文字识别功能?

可以通过编写 AHK 脚本,结合大模型 API 来实现翻译选中的文字和截图识别文字的功能。

在 Windows 上,如何设置热键进行翻译和文字识别?

可以使用 Ctrl + Shift + D 设置翻译热键,Ctrl + Shift + 1 设置文字识别热键。

使用 AHK 脚本时,如何处理翻译结果的编码问题?

需要将翻译结果从 ISO-8859-1 编码转换为 UTF-8 编码,以确保正确显示。

作者为什么选择使用 AHK 而不是现有的翻译工具?

因为现有工具响应慢且翻译质量差,作者希望通过自定义脚本提升功能和效率。

在实现 OCR 功能时,使用了哪些库?

实现 OCR 功能时,使用了 GDIP 库来处理截图和图像。

如何获取翻译和识别文字的结果?

可以通过发送请求到 API,获取翻译或识别的结果,并使用 ToolTip 或 msgbox 显示。

➡️

继续阅读