小红花·文摘 - 小红花技术领袖俱乐部

本文介绍了一种新型音频编解码器及其在语音合成中的应用，提出了自监督学习、源解耦技术和低帧率编解码器等多种改进方法，显著提升了语音合成的可懂性和效率，解决了传统模型的不足。

对神经编解码再合成的深入研究：缩小编解码与波形生成之间的差距

BriefGPT - AI 论文速递 ·

本研究提出了一种低帧率语音编解码器（LFSC），旨在提高训练和推理速度。LFSC通过有限标量量化和对抗训练，以1.89 kbps的比特率和21.5帧每秒的速度实现高质量音频压缩，推理速度提高约三倍，同时保持音质和可懂性。

Low Frame-rate Speech Codec: A Codec Designed for Fast and High-quality Speech Large Language Model Training and Inference

BriefGPT - AI 论文速递 ·