该研究介绍了罗马尼亚方言识别的研究,引入了RoDia数据集,包含了来自五个地区的语音样本和标注数据。最高得分的模型在该数据集上达到了59.83%的宏观F1得分和62.08%的微观F1得分。研究人员认为RoDia是一个有价值的资源,将推动罗马尼亚方言识别的研究。
NVIDIA的Akshit Arora、Rafael Valle、Sungwon Kim和Rohan Badlani通过创建一个AI模型赢得了LIMMITS '24挑战,该模型可以用适当的口音重新创建说话者的英语或六种印度语言的声音。该模型只需要三秒的语音样本,旨在打破语言障碍,创造逼真的对话。团队的努力将集成到NVIDIA Riva中,这是一个用于构建多语言语音和翻译AI软件的框架。
完成下面两步后,将自动完成登录并继续当前操作。