在 Apple Intelligence 到来之前,用快捷指令做个 Gemini 识屏助手
💡
原文中文,约1700字,阅读约需4分钟。
📝
内容提要
从Pixel 9 Pro换到iPhone后,我怀念Gemini的整合功能。通过Gemini API,我设计了快捷指令,能够截屏并识别信息,自动填入日历或提醒,过程简单高效,适合日常使用。
🎯
关键要点
- 从Pixel 9 Pro换到iPhone后,怀念Gemini的整合功能。
- 在Pixel上可以通过长按电源键或'Hey Google'唤起Gemini,完成多项任务。
- 在iPhone上,类似操作需要依赖第三方工具解决。
- 使用Gemini API设计快捷指令,截屏并识别信息,自动填入日历或提醒。
- Gemini以多模态能力见长,适合个人日常使用。
- 快捷指令流程设计简单:截屏 > 识别 > 填入日历或提醒。
- 建议在截屏时使用'截屏'操作,避免图库新增截图。
- 对图像进行适当的'瘦身'以提高执行速度和效率。
- 将截图'喂'给Gemini API时,使用内嵌图片数据和Base64编码。
- 填写请求参数时需注意快捷指令的交互设计问题。
❓
延伸问答
如何在iPhone上使用Gemini API进行信息识别?
可以通过设计快捷指令,截屏并将图像喂给Gemini API进行识别,识别后自动填入日历或提醒。
从Pixel 9 Pro换到iPhone后,用户最怀念的功能是什么?
用户最怀念的是系统级的Gemini整合功能,可以快速完成多项任务。
在设计快捷指令时,有哪些建议可以提高效率?
建议在截屏时使用'截屏'操作,避免图库新增截图,并对图像进行适当的'瘦身'以提高执行速度。
Gemini API的主要优势是什么?
Gemini API以多模态能力见长,适合个人日常使用,且免费层级满足基本需求。
如何处理截屏以便更好地使用Gemini API?
处理截屏时应调整图像大小,并使用内嵌图片数据和Base64编码来提高效率。
使用Gemini API时需要注意哪些请求参数?
填写请求参数时需注意快捷指令的交互设计问题,确保URL内容和API密钥正确。
➡️