Apple Machine Learning Research ·

从交互到影响：通过理解和评估移动用户界面操作影响，迈向更安全的AI代理

💡 原文英文，约300词，阅读约需1分钟。

📝

内容提要

随着生成性人工智能的发展，研究者关注AI代理在移动用户界面（UI）上执行任务的能力。通过专家研讨会，我们建立了影响分类，并收集了用户认为重要的UI操作数据。研究表明，不同大型语言模型在理解这些影响方面存在差异，且在分类复杂影响时显著不足。

🎯

🔎

尽管AI代理在移动用户界面上执行任务的能力不断提升，但其自主行为可能带来风险和不可逆的后果。研究强调，理解这些影响对于确保用户安全至关重要，尤其是在处理敏感信息或执行关键操作时。

通过建立移动UI操作影响的分类体系，研究为AI代理的行为提供了更清晰的框架。这不仅有助于提升大型语言模型的推理能力，也为未来的研究提供了基础，推动更安全的AI代理开发。

研究表明，尽管大型语言模型在理解移动UI操作影响方面有所进展，但在分类复杂影响时仍存在显著不足。这提示开发者在设计AI代理时需谨慎，避免依赖模型的判断而导致潜在风险。

❓

生成性人工智能促进了自主代理的创建，使其能够通过操作用户界面管理日常任务。

研究通过专家研讨会建立了影响分类，并收集用户认为重要的移动UI操作数据进行评估。

研究表明，不同大型语言模型在理解移动UI操作影响的能力上存在差异，且在分类复杂影响时显著不足。

分类体系是通过一系列专家研讨会开发的，旨在系统化移动UI操作的影响。

AI代理的自主行为可能导致风险或不可逆的后果，这些影响尚未得到充分探讨。

研究发现，分类体系增强了大型语言模型的推理能力，但在处理更复杂的影响类别时仍存在显著不足。

🏷️