这两周我到底在做什么?理解唤醒词
💡
原文中文,约1500字,阅读约需4分钟。
📝
内容提要
随着技术的发展,TTS和STT服务已经非常完善。TTS服务可以将文本转换为语音,但中文的语义分析是一个挑战。STT服务可以将语音转换为文字,但需要结合分词器来理解用户的意图。离线版本的TTS和STT服务在业务中被广泛使用。
🎯
关键要点
- TTS和STT服务已经非常完善,广泛应用于听书软件等领域。
- 中文的语义分析是TTS服务中的一个挑战,尤其是多音字的处理。
- 华为的无障碍服务提供了本地离线文件和TTS服务两种音频提示方式。
- TTS服务可以通过多种方式实现,包括使用支持TTS的应用、付费服务或自建服务器。
- 最简单的中文TTS实现方式是将中文转拼音并查询对应的PCM文件。
- STT是语音转文字的服务,应用场景包括翻译软件、语音助手和唤醒词。
- STT服务在业务闭环中难以形成完整的闭环,需要结合分词器理解用户意图。
- 分词器的概念在提取用户关键信息和执行操作中至关重要,影响识别率。
➡️