小红花·文摘

该文章介绍了一种名为TokenSplit的语音分离模型，可在离散标记序列上操作。该模型通过输入掩码实现多任务训练，包括将每个语音源进行分离和转录，并从文本生成语音。作者还介绍了模型的“修正”版本，证明了该模型在分离方面具有优秀的性能，并提供了语音合成的音频样本来展示该模型的附加效用。

BriefGPT - AI 论文速递 ·

PaddleSharp发布新版本，更新文档和示例，增加xml注释和snuget调试功能。设备管理引入多种设备类型选择，加载方式优化解决Linux环境问题。PaddleOCR新增表格识别功能，引入两个新模型包。OCR文字识别阶段支持批处理，性能优秀。PaddleSharp其他功能增强，欢迎尝试。

dotNET跨平台 ·