小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种新颖的对抗相对对比（ARC）后训练算法，旨在加速文本到音频系统的生成速度，使其在约75毫秒内生成12秒高质量立体声音频，成为行业最快的模型。

Fast Text-to-Audio Generation Based on Adversarial Post-Training

BriefGPT - AI 论文速递 ·