基于神经注意力驱动的听觉场景理解
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种基于意图的听觉场景理解(II-ASU)方法,开发了听觉注意力驱动的大型语言模型(AAD-LLM),通过脑电图数据解码听众关注的说话者,实验结果表明其在多说话者场景中的表现优于传统模型。
🎯
关键要点
- 本研究提出了一种基于意图的听觉场景理解(II-ASU)方法。
- 开发了听觉注意力驱动的大型语言模型(AAD-LLM)。
- 该模型利用脑电图(iEEG)数据解码听众关注的说话者。
- 实验结果表明该模型在多说话者场景中的表现优于传统模型。
- 研究解决了现有听觉基础模型未考虑人类听觉选择性的问题。
➡️