小红花·文摘

该文章介绍了一种联合语音与语言模型（SLM），通过冻结预训练的基础模型并训练一个简单适配器，SLM在传统任务上表现出强大性能，并具备零-shot指导的新颖能力。研究结果表明，预训练的语音和语言模型之间的表征差距较小，可以通过简单的适应机制来弥合。SLM不仅训练高效，还继承了不同模态基础模型的强大能力。

语言模型听说能力

BriefGPT - AI 论文速递 ·

该文章介绍了一种联合语音与语言模型（SLM），通过冻结预训练的基础模型并训练一个简单适配器，SLM在传统任务上表现出强大性能，并具备零-shot指导的新颖能力。研究表明，预训练的语音和语言模型之间的表征差距较小，可以通过简单的适应机制来弥合。SLM不仅训练高效，还继承了不同模态基础模型的强大能力。

DeSTA: 通过描述性语音文本对齐提升语音语言模型

BriefGPT - AI 论文速递 ·

SpeechVerse: 一个大规模可推广的音频语言模型

BriefGPT - AI 论文速递 ·

MSLM-S2ST：一个适用于无文本语音到语音翻译的多任务语音语言模型，保持说话人风格

BriefGPT - AI 论文速递 ·