小红花·文摘

本文介绍了多种语音处理技术和语料库的开发，如LibriSpeech、FlauBERT和XLS-R，旨在提升语音翻译和识别性能。研究者们创建了公开的语音训练语料库LibriS2S和GigaSpeech 2，以解决数据不足的问题，并通过自我监督模型和多语言预训练，推动低资源语言的语音技术发展。

BriefGPT - AI 论文速递 ·

本文提出了一种自我监督模型，能够在长视频中联合学习目标物体状态及其变化行为，采用噪声自适应加权模块进行训练，显著提升了目标动作和物体状态识别的性能。同时，研究探讨了弱监督学习方法在动作检测和分类中的应用，展示了在多个数据集上的良好表现。

BriefGPT - AI 论文速递 ·

本文介绍了自我监督模型UNI在计算病理学中的应用，利用超过100万个组织样本进行预训练，显著提升了组织分类和疾病亚型分类的能力。研究表明，该模型在数据效率和泛化能力方面表现优异，尤其适用于复杂的病理图像任务。研究团队通过新技术和算法开发了高效的图像分析方法，推动了病理学的发展。

BriefGPT - AI 论文速递 ·