小红花·文摘

Spotify 的最佳替代音乐流媒体服务推荐

The Verge ·

豆包·播客模型由火山引擎推出，能够快速生成高质量的播客音频，语气自然，接近真人。用户操作简单，支持实时热点话题和长文本解读，具备情感理解和多模态交互能力，提升语音对话的效率与质量。

太逼真！豆包·播客模型来了：一句话生成「苏超联赛」播客，很懂13太保的梗

量子位 ·

本研究提出了一种新颖的对抗相对对比（ARC）后训练算法，旨在加速文本到音频系统的生成速度，使其在约75毫秒内生成12秒高质量立体声音频，成为行业最快的模型。

Fast Text-to-Audio Generation Based on Adversarial Post-Training

BriefGPT - AI 论文速递 ·

Spotify 准备推出具有 Hi-Fi 音频和 AI 功能的高级版本

实时互动网 ·

Matcha-TTS是一种新的编码器-解码器架构，用于快速TTS声学建模。它使用最优传输条件流匹配进行训练，生成基于ODE的解码器，能够在较少的合成步骤中输出高质量音频。该方法是概率的、非自回归的，并且能够在没有外部对齐的情况下学习说话。与预训练基线模型相比，Matcha-TTS系统具有最小的内存占用量，并在听力测试中获得最高的主观评分。

Matcha-TTS：具有条件流匹配的快速 TTS 架构

BriefGPT - AI 论文速递 ·

Meta发布开源AI工具AudioCraft 可帮助用户创作音乐和音频

AI.News ·