利用缓存在小型设备上实现 SLU

💡 原文中文,约600字,阅读约需2分钟。
📝

内容提要

本文探讨了在微控制器嵌入式设备上的口语理解(SLU)技术,将设备上的执行与云端卸载结合。通过利用时间局部性,设备将新输入与缓存结果进行匹配,并将匹配不成功的输入卸载到云端进行完整的推断。作者提出了一种适用于微型设备的语音缓存XYZ,通过聚类的原始声音单元序列和音素序列两个级别来匹配语音输入。实验结果表明,该系统能够在设备上解决45%至90%的输入,平均延迟降低了80%。

🎯

关键要点

  • 本文探讨在微控制器嵌入式设备上的口语理解(SLU)技术。
  • 将设备上的执行与云端卸载结合,通过时间局部性利用缓存结果。
  • 设备将新输入与缓存结果进行匹配,只有匹配不成功的输入才卸载到云端。
  • 提出了一种适用于微型设备的语音缓存XYZ,通过聚类的原始声音单元序列和音素序列进行匹配。
  • 系统能够在设备上解决45%至90%的输入,平均延迟降低了80%。
  • 缓存是可学习的,通过不匹配的输入不断微调设备的特征提取器。
  • 在现成的STM32微控制器上实现了XYZ,内存占用量为2MB。
  • 即使在噪声环境或多个用户共享设备的情况下,系统的优势仍然显著。
➡️

继续阅读