摩尔线程开源了音频理解大模型MooER,支持中英文语音识别和中译英语音翻译。MooER-5K在测试中表现优异,特别是在Covost2中译英测试集上,BLEU分数达到25.2。模型结构包括Encoder、Adapter和Decoder三个部分。训练过程中使用了自研的夸娥智算平台和DeepSpeed框架。MooER与其他开源模型相比效果更优。文章提供了一些有关Encoder选择、音频建模粒度和快速适应到目标垂类的建议。
完成下面两步后,将自动完成登录并继续当前操作。