本文介绍了SELMA,一个用于虚拟助手交互的语音启用语言模型。SELMA同时处理三项主要任务和两项辅助任务,采用低秩适应模块进行高效训练。实验结果表明,SELMA在语音触发检测和设备导向语音检测任务上显著提高了性能,简化了虚拟助手的输入处理流程。
本研究提出并评估了SELMA,一个用于虚拟助理交互的语音启用语言模型,该模型将音频和文本作为输入,旨在同时处理与虚拟助理交互相关的多个任务。通过使用低秩适应模块和特征池策略,SELMA大幅简化了虚拟助理的输入处理流程,并在语音触发和设备导向语音检测等任务上表现出显著的性能提升。
完成下面两步后,将自动完成登录并继续当前操作。