小红花·文摘

本文探讨了深度学习在语音到文本翻译中的应用，重点研究了端到端架构和CTC损失函数的影响。预训练模型显著提升了翻译性能，实验结果表明其在多个数据集上超越了现有系统。此外，提出了基于CTC的动态音频信号压缩方法和流式多语言模型，优化了翻译质量和效率。

CTC-GMM：用于快速准确流式语音翻译的CTC引导模态匹配

BriefGPT - AI 论文速递 ·

字节大模型同传智能体，一出手就是媲美人类的同声传译水平

机器之心 ·

理想AI司机全国上岗，紧跟特斯拉华为转向端到端架构，世界模型也亮相了。理想刚刚召开了2024智能驾驶夏季发布会，升级内容包括智驾范围扩大、主动安全能力提升和系统架构转向端到端。下一代自动驾驶系统将采用快慢系统理论，其中慢系统使用视觉语言模型提供复杂环境和交通规则的理解能力。理想还将在云端采用世界模型加快系统升级。

理想AI司机全国上岗，紧跟特斯拉华为转向端到端架构，世界模型也亮相了

量子位 ·

通往 AGI 的道路，感知模型与大语言模型

橘子汽水铺 ·