💡 原文中文,约4300字,阅读约需11分钟。
📝

内容提要

作者结合赛博小狗与小智AI,使用ESP32实现语音识别和文本转语音功能。尽管遇到库缺失和初始化错误等问题,最终成功实现语音唤醒和指令识别,旨在帮助其他Arduino开发者。

🎯

关键要点

  • 作者结合赛博小狗与小智AI,使用ESP32实现语音识别和文本转语音功能。
  • 赛博小狗项目使用的语音识别模块和文本转语音模块不够灵活,且成本较高。
  • ESP32自带语音唤醒、语音识别和文本转语音能力,适合结合小智AI进行开发。
  • 作者使用Visual Studio Code和PlatformIO作为开发环境,认为比Arduino IDE更强大。
  • 在使用ESP-SR库时,遇到头文件缺失的问题,最终找到正确的库。
  • I2S初始化失败是由于中断函数放在了PSRAM中,需调整参数。
  • 需要单独上传模型数据到Flash中,创建合适的分区配置。
  • 配置唤醒模型和指令识别模型,使用Python脚本生成目标分区数据。
  • 完成语音唤醒和命令识别后,继续配置文本转语音功能。
  • 在测试TTS时,发现输出模式需调整为单声道才能正常工作。
  • 最终成功实现ESP32-S3在Arduino框架下的语音识别和文本转语音功能。
➡️

继续阅读