少数派 ·

在 Apple Intelligence 到来之前，用快捷指令做个 Gemini 识屏助手

💡 原文中文，约1700字，阅读约需4分钟。

📝

内容提要

从Pixel 9 Pro换到iPhone后，我怀念Gemini的整合功能。通过Gemini API，我设计了快捷指令，能够截屏并识别信息，自动填入日历或提醒，过程简单高效，适合日常使用。

🎯

🔎

Gemini API 提供了强大的多模态能力，适合个人日常使用。通过快捷指令，用户可以轻松实现信息识别和自动填充，提升工作效率。尤其是在没有 Apple Intelligence 的情况下，Gemini API 成为解决方案的关键。

在设计快捷指令时，注意截屏操作的选择至关重要。使用「截屏」而非「获取最新的截屏」可以避免图库中新增无用截图。此外，适当调整图像大小以提高处理速度也是提升效率的有效方法。

尽管 Gemini API 功能强大，但在使用过程中可能会遇到交互设计的复杂性。特别是在填写请求参数时，用户需要仔细阅读文档，以确保正确传递信息，避免因操作失误导致的错误。

❓

可以通过设计快捷指令，截屏并将图像喂给Gemini API进行识别，识别后自动填入日历或提醒。

用户最怀念的是系统级的Gemini整合功能，可以快速完成多项任务。

建议在截屏时使用'截屏'操作，避免图库新增截图，并对图像进行适当的'瘦身'以提高执行速度。

Gemini API以多模态能力见长，适合个人日常使用，且免费层级满足基本需求。

处理截屏时应调整图像大小，并使用内嵌图片数据和Base64编码来提高效率。

填写请求参数时需注意快捷指令的交互设计问题，确保URL内容和API密钥正确。

🏷️