基于向量量化的高效检索优化上下文语音识别
原文英文,约300词,阅读约需1分钟。发表于: 。Neural contextual biasing allows speech recognition models to leverage contextually relevant information, leading to improved transcription accuracy. However, the biasing mechanism is typically...
本文提出了一种基于向量量化的交叉注意力近似方法,利用神经上下文偏置提升语音识别模型的转录准确性。该方法通过高效的量化检索模块,从大型偏置目录中快速筛选相关条目,实现个人实体识别中的相对错误率降低71%,同时计算时间减少20%,内存使用降低85-95%。