小红花·文摘 - 小红花技术领袖俱乐部

Claude Desktop 对接 Fish 语音 MCP

Claude Desktop 对接 Fish 语音 MCP

静觅 ·

Voicebox免费开源AI语音克隆 | 本地替代 ElevenLabs

Voicebox免费开源AI语音克隆 | 本地替代 ElevenLabs

极道 ·

在AI Gateway上构建实时语音代理

在AI Gateway上构建实时语音代理

Vercel News ·

AI Gateway 现已支持实时语音、语音生成和音频转录

AI Gateway 现已支持实时语音、语音生成和音频转录

Vercel News ·

xAI Grok音频模型现已在Vercel AI Gateway上线

xAI Grok音频模型现已在Vercel AI Gateway上线

Vercel News ·

微软 Build 2026 大会凸显对话式 AI 的新阶段

微软 Build 2026 大会凸显对话式 AI 的新阶段

实时互动网 ·

Miso Labs发布MisoTTS：一款拥有开放权重的80亿情感文本转语音模型

Miso Labs发布MisoTTS：一款拥有开放权重的80亿情感文本转语音模型

实时互动网 ·

Cursor 对接 Fish 语音 MCP

Cursor 对接 Fish 语音 MCP

静觅 ·

Free CPU教程丨狂揽8.8k stars，TTS模型Supertonic-3参数规模仅约99M，支持31种语言

Free CPU教程丨狂揽8.8k stars，TTS模型Supertonic-3参数规模仅约99M，支持31种语言

HyperAI超神经 ·

Voice Agents 101: The Architecture Behind AI That Can Converse with Humans

Voice Agents 101: The Architecture Behind AI That Can Converse with Humans

Measure Zero ·

在线教程丨支持600+语言，小米开源OmniVoice：仅需3-10秒参考音频实现语音克隆

在线教程丨支持600+语言，小米开源OmniVoice：仅需3-10秒参考音频实现语音克隆

HyperAI超神经 ·

Voxtral TTS是Mistral AI推出的开源文本转语音模型，支持九种语言，能够在三秒音频基础上克隆声音，具有70毫秒的低延迟和9.7倍的实时因子，适合实时对话应用。用户可通过Mistral API或自托管方式使用，提供灵活的商业和非商业使用选项。

Voxtral TTS开源文本转语音模型

KDnuggets ·

xAI推出独立的Grok语音转文本和文本转语音API，目标用户为企业语音开发人员

xAI推出独立的Grok语音转文本和文本转语音API，目标用户为企业语音开发人员

实时互动网 ·

突破零样本 TTS 音色克隆上限：LongCat-AudioDiT 的声音克隆艺术

突破零样本 TTS 音色克隆上限：LongCat-AudioDiT 的声音克隆艺术

美团技术团队 ·

零抽样 TTS 新突破！几秒参考音频，OmniVoice 助你轻松克隆数百种语言；17 种语言一网打尽：MDPBench 解决低资源文字系统解析难的「心头大患」

零抽样 TTS 新突破！几秒参考音频，OmniVoice 助你轻松克隆数百种语言；17 种语言一网打尽：MDPBench 解决低资源文字系统解析难的「心头大患」

HyperAI超神经 ·

Google AI 发布 Gemini 3.1 Flash TTS：表现力强、可控性高的 AI 语音技术新标杆

Google AI 发布 Gemini 3.1 Flash TTS：表现力强、可控性高的 AI 语音技术新标杆

实时互动网 ·

谷歌推出了Gemini 3.1 Flash TTS，这是最新的文本转语音模型，具备更好的可控性、表现力和音质，支持70多种语言，并提供音频标签以控制语音风格和节奏。所有生成的音频都带有不可见水印SynthID，以防止虚假信息传播。

Gemini 3.1 Flash TTS：下一代富有表现力的人工智能语音

The Keyword ·

突破零样本TTS音色克隆上限：LongCat-AudioDiT 的声音克隆艺术

突破零样本TTS音色克隆上限：LongCat-AudioDiT 的声音克隆艺术

实时互动网 ·

Google AI 发布 WAXAL：用于训练自动语音识别和文本转语音模型的多语言非洲语音数据集

Google AI 发布 WAXAL：用于训练自动语音识别和文本转语音模型的多语言非洲语音数据集

实时互动网 ·

Voximplant 将 Cartesia Line 语音代理引入真实通话中

Voximplant 将 Cartesia Line 语音代理引入真实通话中

实时互动网 ·