Metis: 一种具有遮蔽生成预训练的基础语音生成模型

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出Metis模型,通过300K小时的多样语音数据进行预训练和微调,克服现有模型的局限,实现多种语音生成任务的高效适应与优异表现。

🎯

关键要点

  • 本研究提出Metis模型,旨在克服现有模型的局限。
  • Metis模型采用预训练和微调的范式。
  • 使用300K小时的多样语音数据进行遮蔽生成预训练和任务特定微调。
  • Metis在多种语音生成任务上实现了高效适应与出色表现。
  • Metis显示出作为统一语音生成基础模型的潜力。
➡️

继续阅读