重归混沌的BLOG ·

写了个AI Agent服务端

💡 原文中文，约2600字，阅读约需7分钟。

📝

内容提要

本文总结了作者开发语音终端的过程，旨在将智能音响的语音输入转发给大模型deepseek。作者使用ESP32-S3开发板，设计了服务端程序，并应用了VAD、ASR和嵌入向量模型等技术，实现了语音识别和文本转语音功能。尽管面临延迟和模型限制，作者仍在探索大模型的应用。

🎯

❓

作者的主要目的是将智能音响的语音输入转发给大模型deepseek，以便让家里的小朋友体验大模型的便利。

作者使用了VAD、ASR和嵌入向量模型等技术来实现语音识别和文本转语音功能。

作者选择ESP32-S3开发板是因为它可以满足开发语音终端的需求，并且有现成的开源项目可供参考。

服务端程序的内存限制设定为100MB。

作者认为大模型在复杂对话场景中的表现不佳，尤其是在需要多轮对话的情况下。

作者使用了Azure TTS服务将文字转换为语音。

🏷️

Cloudflare Announces Agent Memory, a Managed Persistent Memory Service for AI Agents
Cloudflare announced Agent Memory in private beta, a managed service that ext...
AI Agent 如何为企业上云按下”加速键” —— CRM系统迁移实战
本文探讨了AI Agent在企业云迁移中的应用，以IDC三层CRM系统迁移至亚马逊云为例。与传统手动迁移相比，AI Agent辅助迁移将迁移时间从218分...
开源社区“内战”爆发：Bun 创始人预言“未来将禁止人类贡献”，硅谷大佬纷纷站队！
本文永久链接 – https://tonybai.com/2026/05/01/open-source-civil-war-bun-founder-pre...
在Kubernetes中管理Valkey集群
Over the last several years, Percona has introduced several rock-star Kuberne...
The craziest part of Musk v. Altman happened while the jury was out of the room
Okay, I am not a lawyer so I only understood about half of what just happened...
网友吐槽：OpenClaw又触发了Claude Code当场翻脸还扣钱！
有趣的是，如果你最近的提交中在 JSON 数据块里提到了 OpenClaw，Claude Code 要么会拒绝你的请求，要么会额外收费。一句“openc...