谷歌的新LiteRT加速器为高通Snapdragon驱动的Android设备提供强劲的AI工作负载支持

InfoQ ·

谷歌的新LiteRT加速器为高通Snapdragon驱动的Android设备提供强劲的AI工作负载支持

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

谷歌推出LiteRT的新加速器QNN，显著提升高通Snapdragon 8 SoC设备的AI性能。QNN在CPU上速度提升可达100倍，GPU提升10倍，支持90种LiteRT操作，优化LLM性能。在72个ML模型中，有64个成功实现NPU全委托，极大改善用户体验。

🎯

关键要点

谷歌推出了LiteRT的新加速器QNN，提升高通Snapdragon 8 SoC设备的AI性能。
QNN在CPU上速度提升可达100倍，GPU提升10倍，支持90种LiteRT操作。
QNN旨在优化LLM性能，提供统一简化的工作流程。
在72个ML模型中，有64个成功实现NPU全委托，显著改善用户体验。
在Snapdragon 8 Elite Gen 5 SoC上，56个模型在NPU上运行时间低于5毫秒，而CPU上仅有13个模型达到该标准。
谷歌开发了一个概念应用，利用优化后的Apple FastVLM-0.5B模型，能够几乎即时解释相机的实时场景。
QNN目前仅支持部分Android硬件，主要是Snapdragon 8和Snapdragon 8+ SoC设备。

❓

延伸问答

LiteRT加速器QNN的主要功能是什么？

LiteRT加速器QNN主要用于提升高通Snapdragon 8 SoC设备的AI性能，提供高达100倍的CPU速度提升和10倍的GPU速度提升。

QNN如何改善用户体验？

QNN通过实现64个ML模型的NPU全委托，显著提高了AI任务的处理速度，改善了用户体验。

QNN支持哪些操作？

QNN支持90种LiteRT操作，旨在实现全模型委托以优化性能。

在Snapdragon 8 Elite Gen 5 SoC上，QNN的性能表现如何？

在Snapdragon 8 Elite Gen 5 SoC上，56个模型在NPU上运行时间低于5毫秒，而CPU上仅有13个模型达到该标准。

QNN与之前的TFLite QNN delegate有什么不同？

QNN是谷歌与高通合作开发的替代品，提供统一简化的工作流程，集成了多种SoC编译器和运行时。

QNN目前支持哪些Android设备？

QNN目前仅支持部分Android硬件，主要是Snapdragon 8和Snapdragon 8+ SoC设备。

🏷️

继续阅读

谷歌的AI搜索如此失灵，以至于它可以“忽视”你正在寻找的内容
谷歌的AI搜索在处理“disregard”或“ignore”等词时出现问题，AI概述部分未能提供正常结果，而是给出了类似传统聊天机器人的回应。谷歌尚未对此作出回应。
谷歌宣布将反重力每周配额也增加3倍同时重置本周额度试图平息开发者怒火
谷歌宣布将反重力的每周使用配额增加三倍，并重置本周配额，以回应开发者的不满。然而，开发者认为当前配额仍低于之前，并且具体数字不明确，造成混乱。许多人怀疑谷...
浏览器直接访问正常，过了负载均衡就崩了？只因响应头里多了个空格
文章讨论了一个生产问题：某系统在直接访问时正常，但经过负载均衡后出现连接重置。经过排查发现，后端Java设置响应头时多了一个空格，导致响应头不符合HTTP...
DeepSeek V4 Pro永久降价 AI价格打骨折
DeepSeek公司将其V4 Pro高端AI模型的价格永久降至原价的四分之一，缓存价格降至十分之一，吸引了大量开发者迁移。V4 Pro专注于复杂任务，降价...
协作AI功能的产品实验：基于Python的LLM工具中的集群随机化
在协作环境中，用户之间的相互影响会使传统的用户级A/B测试失效。文章探讨了通过集群随机化来解决这一问题，确保整个团队共同接受或拒绝AI功能，从而减少干扰。...
回顾2026年谷歌I/O大会的Dialogues舞台
本周的I/O大会上，Dialogues舞台汇聚了谷歌的领导者、科学家和创意先锋，讨论了技术突破对社会和未来的影响。