小红花·文摘 - 小红花技术领袖俱乐部

xAI Grok音频模型现已在Vercel AI Gateway上线

xAI Grok音频模型现已在Vercel AI Gateway上线

Vercel News ·

Myna发布，成为Ubuntu桌面系统的语音转文本解决方案

Myna发布，成为Ubuntu桌面系统的语音转文本解决方案

实时互动网 ·

微软 Build 2026 大会凸显对话式 AI 的新阶段

微软 Build 2026 大会凸显对话式 AI 的新阶段

实时互动网 ·

腾讯云与Soniox建立战略合作伙伴关系，共同助力全球多语言语音AI应用发展

腾讯云与Soniox建立战略合作伙伴关系，共同助力全球多语言语音AI应用发展

实时互动网 ·

Voice Agents 101: The Architecture Behind AI That Can Converse with Humans

Voice Agents 101: The Architecture Behind AI That Can Converse with Humans

Measure Zero ·

通过API中的新模型推动语音智能发展

通过API中的新模型推动语音智能发展

OpenAI ·

xAI推出独立的Grok语音转文本和文本转语音API，目标用户为企业语音开发人员

xAI推出独立的Grok语音转文本和文本转语音API，目标用户为企业语音开发人员

实时互动网 ·

audiov – Linux 下的语音输入法(fcitx5)

audiov – Linux 下的语音输入法(fcitx5)

小众软件 ·

GStreamer 1.28.1 发布，新增基于 Whisper 的语音转文本功能，并支持 AV1 有状态 V4L2 解码器

GStreamer 1.28.1 发布，新增基于 Whisper 的语音转文本功能，并支持 AV1 有状态 V4L2 解码器

实时互动网 ·

Deepgram 和 IBM 推出面向企业人工智能的高级语音功能

Deepgram 和 IBM 推出面向企业人工智能的高级语音功能

实时互动网 ·

Mistral 发布 Voxtral Transcribe 2，一款成本极低的开源语音模型

Mistral 发布 Voxtral Transcribe 2，一款成本极低的开源语音模型

实时互动网 ·

Handy – 听写助手！按下快捷键说话，松开输入文字。完全离线，本地运行

Handy – 听写助手！按下快捷键说话，松开输入文字。完全离线，本地运行

小众软件 ·

微软发布 VibeVoice-ASR：一种统一的语音转文本模型，旨在一次性处理长达 60 分钟的音频

微软发布 VibeVoice-ASR：一种统一的语音转文本模型，旨在一次性处理长达 60 分钟的音频

实时互动网 ·

10 款不能错过的免费软件[20260122]

10 款不能错过的免费软件[20260122]

小众软件 ·

GLM ASR试用

年华转瞬 ·

Deepgram 在 Amazon SageMaker AI 上推出流媒体语音、文本和语音代理

Deepgram 在 Amazon SageMaker AI 上推出流媒体语音、文本和语音代理

实时互动网 ·

Cursor 2.0 IDE 现已强大升级，集成AI功能让我印象深刻

Cursor 2.0 IDE 现已强大升级，集成AI功能让我印象深刻

The New Stack ·

Shotcut 25.07 视频编辑器带来多项改进

Shotcut 25.07 视频编辑器带来多项改进

实时互动网 ·

200+ 个语音转文本后处理的自定义系统提示

200+ 个语音转文本后处理的自定义系统提示

DEV Community ·

到 2034 年，语音转文本 API 市场规模将达到 210 亿美元

到 2034 年，语音转文本 API 市场规模将达到 210 亿美元

实时互动网 ·