重磅更新!PaddleSpeech r1.5.0 整体适配飞桨框架3.0,新增大模型音频编码器DAC组件
API 全面退场,PIR + predictor 升级, 0-d tensor,view 行为修改等多方面适配,保证开发者们在使用我们的模型时的正确性。为一款常用的音频编解码器,常用于为语音大模型生成音频token,本次新版本的PaddleSpeech中支持了DAC模型训练及推理所需的音频处理相关的。新版本支持通过参数来控制使用不同的 am/voc 模型,支持的模型在对应的...
PaddleSpeech是基于飞桨的开源语音项目,最新发布的1.5.0版本适配飞桨3.0,新增DAC模型支持和AudioTools模块,优化了音频处理功能和损失函数,提高了模型的准确性和易用性。