摩尔线程正式开源音频理解大模型MooER
原文中文,约2600字,阅读约需7分钟。发表于: 。近日,摩尔线程重磅开源了音频理解大模型—MooER(摩耳),该开源项目已在GitHub上公布:https://github.com/MooreThreads/MooER。 MooE...
摩尔线程开源了音频理解大模型MooER,支持中英文语音识别和中译英语音翻译。MooER-5K在测试中表现优异,特别是在Covost2中译英测试集上,BLEU分数达到25.2。模型结构包括Encoder、Adapter和Decoder三个部分。训练过程中使用了自研的夸娥智算平台和DeepSpeed框架。MooER与其他开源模型相比效果更优。文章提供了一些有关Encoder选择、音频建模粒度和快速适应到目标垂类的建议。