TokenSynth: A Token-Based Neural Synthesizer for Instrument Cloning and Text-to-Instrument Generation
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了TokenSynth模型,旨在解决乐器克隆和文本生成中的合成质量与灵活性问题。该模型通过解码器单一变压器生成音频令牌,展示了先进神经音频编码器的应用潜力。
🎯
关键要点
- 本研究提出了TokenSynth模型,旨在解决乐器克隆和文本生成中的合成质量与灵活性问题。
- TokenSynth使用解码器单一变压器,从MIDI和CLAP嵌入生成音频令牌,无需微调。
- 该模型展现了先进神经音频编码器的应用潜力,能够实现多样化的声音设计和直观的音色控制。
- TokenSynth适用于文本到语音、文本到音频和文本到音乐生成等音频生成任务。
🏷️
标签
➡️