小红花·文摘

本研究提出了一种基于意图的听觉场景理解方法（II-ASU），并开发了听觉注意力驱动的大型语言模型（AAD-LLM）。该模型通过脑电图数据解码听众关注的说话者，生成更符合听众意图的响应，实验结果显示其在多说话者场景中的表现优于传统模型。

BriefGPT - AI 论文速递 ·

本文介绍了一种多语言语音翻译模型，支持无文本的语音到语音翻译，采用自监督技术优化多说话者语音。研究表明，该模型在多语言翻译中优于传统双语模型，并在不同任务上取得显著改进，展现出强大的翻译能力和效率。

BriefGPT - AI 论文速递 ·