复刻小智AI，ESP32-S3搭建Arduino+ESP-SR+ESP-TTS开发环境踩坑记录

Architecting Life ·

复刻小智AI，ESP32-S3搭建Arduino+ESP-SR+ESP-TTS开发环境踩坑记录

💡 原文中文，约4300字，阅读约需11分钟。

📝

内容提要

作者结合赛博小狗与小智AI，使用ESP32实现语音识别和文本转语音功能。尽管遇到库缺失和初始化错误等问题，最终成功实现语音唤醒和指令识别，旨在帮助其他Arduino开发者。

🎯

关键要点

作者结合赛博小狗与小智AI，使用ESP32实现语音识别和文本转语音功能。
赛博小狗项目使用的语音识别模块和文本转语音模块不够灵活，且成本较高。
ESP32自带语音唤醒、语音识别和文本转语音能力，适合结合小智AI进行开发。
作者使用Visual Studio Code和PlatformIO作为开发环境，认为比Arduino IDE更强大。
在使用ESP-SR库时，遇到头文件缺失的问题，最终找到正确的库。
I2S初始化失败是由于中断函数放在了PSRAM中，需调整参数。
需要单独上传模型数据到Flash中，创建合适的分区配置。
配置唤醒模型和指令识别模型，使用Python脚本生成目标分区数据。
完成语音唤醒和命令识别后，继续配置文本转语音功能。
在测试TTS时，发现输出模式需调整为单声道才能正常工作。
最终成功实现ESP32-S3在Arduino框架下的语音识别和文本转语音功能。

🏷️

继续阅读

10 款不能错过的免费软件[20260122]
文章介绍了多个开源AI工具，包括离线语音转文本的Handy、自动化壁纸工具、截图工具Snow Shot、命令行AI工具AionUi、安卓自动化工具Ruto...
把医疗AI禁锢在严肃区间：百川M3 Plus首创“证据锚定”，幻觉率2.6%刷新全球纪录
百川M3 Plus医疗AI模型通过“证据锚定”技术将幻觉率降低至2.6%，刷新全球纪录，旨在提升医疗AI的可信度，辅助医生做出科学决策，并通过“海纳百川计...
迷你书：AI时代的架构：变革与机遇
现代软件架构面临挑战，AI迅速发展导致系统复杂性增加，架构师的角色也在不断演变。团队需在自主性与一致性之间找到平衡，同时确保系统的可靠性。本文汇集行业见解...
Gitee 企业版 AI 队友邀测开启：程序员的贴身助理来了
Gitee企业版推出的“AI队友”功能，通过智能分析提升PR审查和安全漏洞排查的效率，自动识别潜在风险，帮助团队更好地管理代码安全，支持多仓库和灵活配置规...
Robo.ai将支持中东、北非、东南亚核心AI基础设施建设需求
Robo.ai Inc.与The Ghazi Group签署三年战略协议，成为中东、北非和东南亚的金牌分销商，提供全自动驾驶车辆的AI基础设施，以满足区域...
Gitee MCP 上线 Trae，AI 助手从代码生成走向仓库联动
Trae 是字节跳动推出的 AI IDE，支持 Gitee MCP，帮助开发者高效管理代码仓库和协作开发。用户可通过简单配置将 Gitee MCP Ser...

复刻小智AI，ESP32-S3搭建Arduino+ESP-SR+ESP-TTS开发环境踩坑记录

内容提要

关键要点

标签

继续阅读