本文介绍了多种语音处理技术和语料库的开发,如LibriSpeech、FlauBERT和XLS-R,旨在提升语音翻译和识别性能。研究者们创建了公开的语音训练语料库LibriS2S和GigaSpeech 2,以解决数据不足的问题,并通过自我监督模型和多语言预训练,推动低资源语言的语音技术发展。
本文提出了一种自我监督模型,能够在长视频中联合学习目标物体状态及其变化行为,采用噪声自适应加权模块进行训练,显著提升了目标动作和物体状态识别的性能。同时,研究探讨了弱监督学习方法在动作检测和分类中的应用,展示了在多个数据集上的良好表现。
本文介绍了自我监督模型UNI在计算病理学中的应用,利用超过100万个组织样本进行预训练,显著提升了组织分类和疾病亚型分类的能力。研究表明,该模型在数据效率和泛化能力方面表现优异,尤其适用于复杂的病理图像任务。研究团队通过新技术和算法开发了高效的图像分析方法,推动了病理学的发展。
完成下面两步后,将自动完成登录并继续当前操作。