小红花·文摘

本研究提出了一种共享编码器，旨在提高自动驾驶中方向盘角度估计的准确性。通过融合多样化的视觉信息，该编码器增强了特征学习能力，显著改善了复杂驾驶场景下的性能。

Human Insights Driven Latent Space for Different Driving Perspectives: A Unified Encoder for Efficient Multi-Task Inference

BriefGPT - AI 论文速递 ·

本文介绍了一种新颖的双语端到端模型，通过共享编码器和预测网络，并通过自注意机制组合语言特定的联合网络，实现了单一神经模型对多种语言的识别和支持语言之间的动态切换。该方法在印地语、英语和混合代码测试集上分别降低了13.3%、8.23%和1.3%的词误差率。

使用多个 softmax 上的注意力的流式双语端到端自动语音识别模型

BriefGPT - AI 论文速递 ·

本文提出了统一的时空扩散模型（USTD），利用共享的时空编码器和基于注意力的去噪网络，捕捉条件时空模式并生成预测。USTD 在预测和 Kriging 的下游任务中表现出最先进的性能，并提供了不确定性估计。

融合扩散模型的概率时空图学习方法

BriefGPT - AI 论文速递 ·

本文提出了一种无监督神经文本简化的框架，使用未标记文本语料库进行训练，可以在词汇和句法两个级别上进行文本简化，竞争现有的监督方法。同时，增加标记的对也可以进一步提高性能。

医疗文本简化：通过不太可能的训练和重新排序的束搜索解码来优化可读性

BriefGPT - AI 论文速递 ·

本文研究了基于端到端模型训练语音模型的近期方法进展，发现针对语音文本对齐的时长模型是最重要的，同时共享编码器能够学习到更紧凑重叠的语音文本表示，这也是 Maestro 共享语音文本表示性能优异的部分原因。

基于联合语音 - 文本模型的小样本语音理解

BriefGPT - AI 论文速递 ·

本文研究了基于端到端模型训练语音模型的方法进展，通过分析共享语音文本表示的两种方法，扩展了对其理解。研究发现时长模型对语音文本对齐非常重要，有助于学习共享语音文本表示。同时，比较了单一编码器和共享编码器的激活相似性，发现共享编码器能够学习到更紧凑重叠的语音文本表示，这也是Maestro共享语音文本表示性能优异的原因之一。

改进不需要对齐的联合语音文本表示

BriefGPT - AI 论文速递 ·