Gemini的任务自动化功能在Pixel 10 Pro和Galaxy S26 Ultra上进行测试,尽管速度较慢且操作繁琐,但展现了未来的潜力。它能够在后台处理外卖和打车等简单任务,用户仍需确认最终订单。尽管存在一些问题,Gemini在理解自然语言和访问用户信息方面表现出色,预示着移动助手的新发展方向。
本研究提出了一种新架构CHOP,旨在提高视觉语言模型(VLM)移动助手在子任务规划中的效率和可执行性。通过使用人工规划的子任务作为基础向量,CHOP在图形用户界面(GUI)场景中显著提升了任务完成效果与效率,并在20款应用中验证了其改进效果。
Google推出了新功能,为其数字助手Gemini提供了AI驱动的移动助手。Gemini Live允许用户与助手进行自由对话,根据需要中断或暂停对话。更新还包括10种新的可选择声音。Gemini将与各种Google应用程序和工具集成,如Keep、Tasks、Utilities和YouTube Music,使完成任务无需在应用程序之间切换更加容易。该助手完全集成到Android用户体验中,提供上下文感知能力。Google计划继续改进Gemini,并与Google Home、Phone和Messages进行更深入的集成。
完成下面两步后,将自动完成登录并继续当前操作。