在 Apple Intelligence 到来之前,用快捷指令做个 Gemini 识屏助手

💡 原文中文,约1700字,阅读约需4分钟。
📝

内容提要

从Pixel 9 Pro换到iPhone后,我怀念Gemini的整合功能。通过Gemini API,我设计了快捷指令,能够截屏并识别信息,自动填入日历或提醒,过程简单高效,适合日常使用。

🎯

关键要点

  • 从Pixel 9 Pro换到iPhone后,怀念Gemini的整合功能。
  • 在Pixel上可以通过长按电源键或'Hey Google'唤起Gemini,完成多项任务。
  • 在iPhone上,类似操作需要依赖第三方工具解决。
  • 使用Gemini API设计快捷指令,截屏并识别信息,自动填入日历或提醒。
  • Gemini以多模态能力见长,适合个人日常使用。
  • 快捷指令流程设计简单:截屏 > 识别 > 填入日历或提醒。
  • 建议在截屏时使用'截屏'操作,避免图库新增截图。
  • 对图像进行适当的'瘦身'以提高执行速度和效率。
  • 将截图'喂'给Gemini API时,使用内嵌图片数据和Base64编码。
  • 填写请求参数时需注意快捷指令的交互设计问题。

延伸问答

如何在iPhone上使用Gemini API进行信息识别?

可以通过设计快捷指令,截屏并将图像喂给Gemini API进行识别,识别后自动填入日历或提醒。

从Pixel 9 Pro换到iPhone后,用户最怀念的功能是什么?

用户最怀念的是系统级的Gemini整合功能,可以快速完成多项任务。

在设计快捷指令时,有哪些建议可以提高效率?

建议在截屏时使用'截屏'操作,避免图库新增截图,并对图像进行适当的'瘦身'以提高执行速度。

Gemini API的主要优势是什么?

Gemini API以多模态能力见长,适合个人日常使用,且免费层级满足基本需求。

如何处理截屏以便更好地使用Gemini API?

处理截屏时应调整图像大小,并使用内嵌图片数据和Base64编码来提高效率。

使用Gemini API时需要注意哪些请求参数?

填写请求参数时需注意快捷指令的交互设计问题,确保URL内容和API密钥正确。

➡️

继续阅读