语音界Deepseek!百度最新跨模态端到端语音交互,成本最高降90%

低成本正在成为模型厂商获得主动权的重要突破口

百度推出的端到端语音语言大模型,利用Cross-Attention技术将语音交互成本降低90%,提升响应速度和真实感。该模型结合语音识别与语言模型,解决了传统语音交互的痛点,推动了大模型在语音领域的应用。

原文中文,约3800字,阅读约需10分钟。发表于:
阅读原文