AAAI 2026|MARS:基于多模态检索和选择增强的对话LLM语音识别

AAAI 2026|MARS:基于多模态检索和选择增强的对话LLM语音识别

实时互动网 实时互动网 ·

西北工业大学与南洋理工大学合作提出MARS方法,通过多模态检索和选择历史上下文,提升对话语音识别(ASR)性能。该方法在MLC-SLM数据集上表现优异,展示了有效利用历史上下文的潜力。

原文中文,约6600字,阅读约需16分钟。
阅读原文