使用自监督技术学习歌手身份表示

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一个框架,通过自监督学习和数据增强训练歌手身份编码器,用于歌唱相关任务。该框架在多个数据集上表现出色,并在领域外泛化方面优于其他方法。研究者还发布了代码和训练模型,以促进进一步的研究。

🎯

关键要点

  • 提出了一个框架,通过自监督学习和数据增强训练歌手身份编码器。
  • 该框架适用于各种歌唱相关任务,如歌声相似性和合成。
  • 在多个数据集上评估了生成的表示,重点关注领域外泛化。
  • 框架在44.1 kHz下产生高质量的嵌入,优于说话人验证和wav2vec 2.0预训练基线。
  • 研究者发布了代码和训练模型,以促进进一步研究。
➡️

继续阅读