BriefGPT - AI 论文速递 ·

多语种 ASR 中新语种整合的低秩自适应双通道模型

💡 原文中文，约1900字，阅读约需5分钟。

📝

内容提要

本文介绍了LoRA-Whisper模型，通过引入LoRA矩阵，提升多语种自动语音识别性能，减少语言干扰。在八种语言的实验中，LoRA-Whisper在多语种识别和语言扩展上分别提高了18.5%和23.0%。研究还探讨了低秩适应方法在低资源语言和跨语言转移中的应用，显示出良好的性能和适应能力。

🎯

❓

LoRA-Whisper模型通过引入LoRA矩阵，减轻多语种自动语音识别中的语言干扰，提升识别性能。

在八种语言的实验中，LoRA-Whisper在多语种识别和语言扩展上分别提高了18.5%和23.0%。

低秩适应方法在低资源语言和跨语言转移中表现出色，显示出良好的性能和适应能力。

LoRA通过可训练秩分解矩阵注入变压器结构，减少了可训练参数，同时保持了与微调相当的性能。

ALoRA方法通过修剪LoRA排名，优化Transformer模块的适应性，实验结果优于基准模型。

LoRA-Whisper模型在真实任务实验中表现出色，显著提高了多语种自动语音识别的准确性。

🏷️