谷歌的新LiteRT加速器为高通Snapdragon驱动的Android设备提供强劲的AI工作负载支持

InfoQ ·

谷歌的新LiteRT加速器为高通Snapdragon驱动的Android设备提供强劲的AI工作负载支持

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

谷歌推出LiteRT的新加速器QNN，显著提升高通Snapdragon 8 SoC设备的AI性能。QNN在CPU上速度提升可达100倍，GPU提升10倍，支持90种LiteRT操作，优化LLM性能。在72个ML模型中，有64个成功实现NPU全委托，极大改善用户体验。

🎯

关键要点

谷歌推出了LiteRT的新加速器QNN，提升高通Snapdragon 8 SoC设备的AI性能。
QNN在CPU上速度提升可达100倍，GPU提升10倍，支持90种LiteRT操作。
QNN旨在优化LLM性能，提供统一简化的工作流程。
在72个ML模型中，有64个成功实现NPU全委托，显著改善用户体验。
在Snapdragon 8 Elite Gen 5 SoC上，56个模型在NPU上运行时间低于5毫秒，而CPU上仅有13个模型达到该标准。
谷歌开发了一个概念应用，利用优化后的Apple FastVLM-0.5B模型，能够几乎即时解释相机的实时场景。
QNN目前仅支持部分Android硬件，主要是Snapdragon 8和Snapdragon 8+ SoC设备。

🏷️

继续阅读

X/Twitter加强客户端验证导致解锁BL/未谷歌认证设备无法发帖目前已撤回封禁
社交网站X/Twitter加强客户端验证，导致许多正常用户无法通过Android/iOS客户端发帖。虽然此举旨在打击机器人，但反而影响了用户。部分用户反馈...
短剧“变天”，AI真人剧产能暴涨千倍
短剧机会窗口期越来越短。数日前，“短剧变天”的传闻在行业引起了轩然大波，相关话题讨论连续数日霸屏微博热搜。3月7日，抖音集团副总裁李亮发微博回应称，红果会...
AI 不只是聊天：小龙虾背后的范式变化
小龙虾（OpenClaw）展示了三种AI应用方式：聊天AI、自动化工具和AI代理。聊天AI用于回答问题，自动化工具处理流程，而小龙虾能够自主规划任务。尽管...
AI客服越智能越坑人？坑了商家、坑客户，咋办？
AI客服给商家和顾客带来了困扰。商家面临客户诱导生成折扣码的问题，顾客则因无法解决问题而感到沮丧。AI客服的设计主要是为了节省成本，未必能有效解决实际问题...
派早报：达摩院发布脂肪肝筛查 AI 模型 MAOSS 等
阿里巴巴达摩院与多家医院合作研发的脂肪肝筛查AI模型MAOSS，能够通过CT影像和血清指标精准筛查肝脂肪分期，将高风险患者的检出率提升至52.4%。该研究...
OpenAI和谷歌的员工支持Anthropic对五角大楼的诉讼
致命自主武器在新环境中表现不可靠，无法准确识别目标，缺乏人类判断能力，因此决策过程中需有人类参与以确保安全。

谷歌的新LiteRT加速器为高通Snapdragon驱动的Android设备提供强劲的AI工作负载支持

内容提要

关键要点

标签

继续阅读