小红花·文摘

首页
广场
排行榜^🏆
直播
FAQ

摩尔线程开源了音频理解大模型MooER，支持中英文语音识别和中译英语音翻译。MooER-5K在测试中表现优异，特别是在Covost2中译英测试集上，BLEU分数达到25.2。模型结构包括Encoder、Adapter和Decoder三个部分。训练过程中使用了自研的夸娥智算平台和DeepSpeed框架。MooER与其他开源模型相比效果更优。文章提供了一些有关Encoder选择、音频建模粒度和快速适应到目标垂类的建议。