InfoQ ·

Voices为Java应用程序提供快速文本转语音功能

💡 原文英文，约1200词，阅读约需5分钟。

📝

内容提要

Voices是一个开源文本转语音项目，支持Java 17及以上版本，无需外部API。它利用ONNX Runtime加速训练和推理，兼容多种深度学习框架。最新版本0.0.8可生成多种语言的自然语音音频文件。

🎯

🔎

Voices库特别适合需要快速生成自然语音的场景，如语音助手、教育应用或内容创作。与其他文本转语音解决方案相比，Voices在使用便捷性和语音质量上表现更佳，尤其适合Java开发者。

Voices支持在GPU上运行模型，这对于需要处理大量数据或实时生成语音的应用尤为重要。开发者应关注如何配置依赖，以充分利用硬件加速，提高应用性能。

在使用Voices时，建议开发者进行有限的输出测试，确保输入的正确性。由于语音合成的复杂性，某些输入可能会导致不理想的输出，因此需要谨慎处理。

❓

Voices是一个开源文本转语音项目，支持Java 17及以上版本，无需外部API，能够生成多种语言的自然语音音频文件。

在Maven中配置Voices库需要添加多个依赖项，包括chorus、alba和onnxruntime等。

Voices更易于使用且声音质量更高，尤其适合快速生成自然语音的场景。

Voices支持多种硬件和操作系统配置，并利用硬件加速器提高性能。

可以通过添加OpenVoice的依赖项并使用OpenVoiceSupplier模型来提高语音质量，但需要更多计算能力。

Voices的创建者Henry Coles希望在Java中生成语音，因为大多数现代TTS库是用Python编写的。

🏷️