小红花·文摘

本文介绍了一种基于大型语言模型（LLM）的生成对话系统，能够实现全双工实时对话，提升用户满意度。研究表明，LLM在语音理解和生成方面具有潜力，结合声学模型可实现更自然的交互。此外，提出的“textless”模型能够在无文本输入的情况下生成自然对话语音，展示了多模态模型在口语学习和对话生成中的应用前景。