使用自监督技术学习歌手身份表示
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一个框架,通过自监督学习和数据增强训练歌手身份编码器,用于歌唱相关任务。该框架在多个数据集上表现出色,并在领域外泛化方面优于其他方法。研究者还发布了代码和训练模型,以促进进一步的研究。
🎯
关键要点
- 提出了一个框架,通过自监督学习和数据增强训练歌手身份编码器。
- 该框架适用于各种歌唱相关任务,如歌声相似性和合成。
- 在多个数据集上评估了生成的表示,重点关注领域外泛化。
- 框架在44.1 kHz下产生高质量的嵌入,优于说话人验证和wav2vec 2.0预训练基线。
- 研究者发布了代码和训练模型,以促进进一步研究。
➡️