苹果的Ferret-UI Lite是一种优化的3B参数模型,旨在理解屏幕图像和UI元素,并与应用直接互动。研究者开发了小型设备端GUI代理,提升了复杂布局中的准确性,表现优于大型模型。尽管在长任务上仍面临挑战,但Ferret-UI Lite可作为设备端智能代理,增强隐私保护。
在设备上部署小型语言模型(SLMs)可以改善延迟和隐私,但面临准确性和内存挑战。CAMPHOR是一个创新的设备端SLM框架,能处理多用户输入并在本地推理个人上下文,确保隐私。其架构通过高阶推理代理分解任务,协调专家代理进行上下文检索、工具交互和计划生成。通过参数共享和提示压缩,减少模型大小、延迟和内存。实验显示,微调的SLM代理在任务完成上优于封闭源LLMs,并增强隐私。
本文介绍了一种为AIoT系统中的设备端时间序列预测而优化的Transformer硬件加速器的设计,实现了6位和4位量化的Transformer模型。4位量化模型相比8位量化模型,测试损失仅增加0.63%,运行速度提高132.33倍,能耗减少48.19倍。
完成下面两步后,将自动完成登录并继续当前操作。