划词翻译、OCR 文字提取:我用 AutoHotKey 给自己写了一个小工具
💡
原文中文,约10700字,阅读约需26分钟。
📝
内容提要
本文介绍了作者如何利用 AutoHotKey (AHK) 脚本和大模型 API 在 Windows 上实现翻译和文字识别功能,模仿 Mac 上的翻译软件 Bob,解决了现有工具响应慢和质量差的问题,并分享了代码示例和技巧。
🎯
关键要点
- 作者利用 AutoHotKey (AHK) 脚本和大模型 API 在 Windows 上实现翻译和文字识别功能。
- 模仿 Mac 上的翻译软件 Bob,解决了现有工具响应慢和质量差的问题。
- 使用 PowerToys 和 AHK 热键实现翻译和文字识别,但效果不佳。
- 找到 STranslate 工具,但仍希望通过自定义脚本提升功能。
- 使用 AHK 脚本和 AI 生成代码实现翻译和识别功能,过程有趣。
- 准备工作包括安装 AHK、JSON 库和 GDIP 库。
- 设置热键以实现翻译和文字识别功能,使用剪贴板获取内容。
- 发送请求获取翻译和识别结果,处理不同 API 的请求格式。
- 处理翻译结果的编码问题,将结果从 ISO-8859-1 转为 UTF-8。
- 显示结果的方法包括 ToolTip 和 msgbox,方便用户查看。
- 脚本可根据需要修改或添加功能,提升使用体验。
- 提供完整的 AHK 代码供参考,方便读者学习和使用。
❓
延伸问答
如何使用 AutoHotKey 实现翻译和文字识别功能?
可以通过编写 AHK 脚本,结合大模型 API 来实现翻译选中的文字和截图识别文字的功能。
在 Windows 上,如何设置热键进行翻译和文字识别?
可以使用 Ctrl + Shift + D 设置翻译热键,Ctrl + Shift + 1 设置文字识别热键。
使用 AHK 脚本时,如何处理翻译结果的编码问题?
需要将翻译结果从 ISO-8859-1 编码转换为 UTF-8 编码,以确保正确显示。
作者为什么选择使用 AHK 而不是现有的翻译工具?
因为现有工具响应慢且翻译质量差,作者希望通过自定义脚本提升功能和效率。
在实现 OCR 功能时,使用了哪些库?
实现 OCR 功能时,使用了 GDIP 库来处理截图和图像。
如何获取翻译和识别文字的结果?
可以通过发送请求到 API,获取翻译或识别的结果,并使用 ToolTip 或 msgbox 显示。
➡️