InfoQ ·

谷歌增强LiteRT以实现更快的设备端推理

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

LiteRT新版本简化了机器学习推理，增强了GPU和NPU加速支持。新API使开发者更易利用加速，模型速度提升25倍，功耗降低5倍，同时优化了推理性能，支持异步执行以减少延迟。

🎯

关键要点

LiteRT新版本简化了设备上的机器学习推理，增强了GPU加速和对NPU的支持。
新API使开发者更容易利用GPU和NPU加速，模型速度提升可达25倍，功耗降低可达5倍。
LiteRT引入了MLDrift，提供更高效的张量数据组织和智能计算，优化数据传输和转换。
针对NPU，LiteRT与高通和联发科技合作，支持其NPU，加速视觉、音频和自然语言处理模型。
新API允许开发者在创建编译模型时指定目标后端，简化了开发过程。
LiteRT引入了TensorBuffer API，消除了GPU和CPU内存之间的数据复制，支持异步执行以减少延迟。
LiteRT可从GitHub下载，并提供多个示例应用程序以演示其使用方法。

❓

延伸问答

LiteRT的新版本有哪些主要改进？

LiteRT的新版本简化了机器学习推理，增强了GPU和NPU加速支持，模型速度提升25倍，功耗降低5倍。

LiteRT如何支持GPU和NPU加速？

LiteRT通过新API简化了GPU和NPU的使用，允许开发者更容易地利用这些加速器，提高模型性能。

LiteRT的MLDrift功能有什么优势？

MLDrift提供更高效的张量数据组织和智能计算，优化数据传输和转换，提升GPU推理性能。

如何在LiteRT中指定目标后端？

开发者可以使用CompiledModel::Create方法在创建编译模型时指定目标后端，如CPU、GPU或NPU。

LiteRT如何减少推理延迟？

LiteRT支持异步执行和TensorBuffer API，消除了GPU和CPU内存之间的数据复制，从而减少延迟。

LiteRT可以在哪里下载？

LiteRT可以从GitHub下载，并提供多个示例应用程序以演示其使用方法。

🏷️

继续阅读

五种强大的Python装饰器，构建整洁的AI代码
本文介绍了五种实用的Python装饰器，旨在提高AI和机器学习代码的整洁性。这些装饰器包括：限制并发请求、结构化日志记录、特征注入、确定性种子设置和开发模...
如何使用Scikit-Learn、AWS Lambda和API Gateway部署无服务器垃圾邮件分类器
在数字时代，垃圾邮件成为安全威胁。开发者利用机器学习构建智能过滤器，本文介绍了一个无服务器垃圾邮件分类器项目，结合Scikit-learn和AWS服务，实...
配备谷歌内置的汽车将因Gemini而变得更智能
Gemini是谷歌助手的升级版，已在配备谷歌内置的汽车中推出。用户可以通过自然对话获取信息、规划行程、管理消息和控制车辆功能。Gemini支持实时更新，帮...
微软的DLSS竞争对手现已在Xbox Ally X手持设备上可用
微软正在测试其自动超分辨率（Auto SR）功能，旨在提升Xbox Ally X手持设备的游戏画质和帧率。该功能通过降低分辨率来提高帧率，并在大屏幕上提升...
Gemini助手正在向内置谷歌助手的汽车推出
谷歌为内置谷歌助手的汽车推出Gemini AI助手，提供更自然的对话体验。此更新适用于2020年及以后的车型，通过软件更新实现。Gemini可以推荐餐厅、...
在谷歌地图上探索66号公路的新方式
美国66号公路长达2448英里，连接芝加哥和圣塔莫尼卡。为庆祝其100周年，推出两种新方式，帮助人们虚拟或现实中探索这条公路。