语音界Deepseek!百度最新跨模态端到端语音交互,成本最高降90% 低成本正在成为模型厂商获得主动权的重要突破口 百度推出的端到端语音语言大模型,利用Cross-Attention技术将语音交互成本降低90%,提升响应速度和真实感。该模型结合语音识别与语言模型,解决了传统语音交互的痛点,推动了大模型在语音领域的应用。 Cross-Attention deepseek 交互成本 响应速度 百度 语音模型 语音识别