小红花·文摘

本文介绍了多种语音处理技术，包括CTC模型对齐算法、Diff-TTSG合成语音与手势的联合学习模型、Dynamic-SUPERB基准评估平台、H-UDM不流利演讲建模方法及YOLO-Stutter检测技术，旨在提高语音对齐、合成质量和不流利检测的准确性与效率。