本研究提出了一种单阶段联合语音-文本监督微调方法,旨在解决现有语音语言模型在多轮对话中的微调难题及灾难性遗忘问题。该方法结合不同类型的语音数据,提升了语音基准测试表现,同时保持文本任务性能。
完成下面两步后,将自动完成登录并继续当前操作。