小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Cloudflare推出了Agents SDK的实验性语音管道,允许开发者为AI代理添加实时语音功能。通过@cloudflare/voice,用户可以实现语音交互,支持语音转文本和文本转语音,简化音频传输和处理流程,提升代理的多模态交互能力。

为您的代理添加语音功能

The Cloudflare Blog
The Cloudflare Blog · 2026-04-15T13:00:00Z
Seed 全双工语音大模型发布:懂倾听、抗干扰,走向更自然的交互

字节跳动推出的全双工语音大模型Seeduplex,提升了语音交互的自然性和流畅度,具备精准抗干扰和动态判停能力,能在复杂环境中有效理解用户意图,降低误回复和误打断率。该模型已在豆包App上线,提供高质量实时语音体验。

Seed 全双工语音大模型发布:懂倾听、抗干扰,走向更自然的交互

实时互动网
实时互动网 · 2026-04-09T06:11:12Z

谷歌AI推出Gemini 3.1 Flash Live,帮助开发者构建实时语音和视觉代理。该模型提升了对话自然性和响应速度,支持90多种语言,并能在嘈杂环境中更好地执行任务。开发者可通过Gemini Live API集成,增强应用交互体验。

使用Gemini 3.1 Flash Live构建实时对话代理

The Keyword
The Keyword · 2026-03-26T15:00:00Z
PersonaPlex - 一种构建低延迟全双工语音对话系统的框架……

PersonaPlex是NVIDIA推出的实时语音对话框架,支持全双工交互和角色控制,适用于客户服务和虚拟主持人等场景。其特点包括低延迟音频流、可定制助手和自然语音嵌入,基于Moshi架构,优化对话质量。

PersonaPlex - 一种构建低延迟全双工语音对话系统的框架……

云原生
云原生 · 2026-01-23T14:56:04Z
Voximplant 和 Deepgram 将生产级语音 AI 应用于真实通话

云通信平台Voximplant宣布支持Deepgram的语音代理API,简化实时语音AI的部署。开发者可在通话中使用语音识别和合成功能,无需管理复杂基础设施,提升了语音AI的可靠性和低延迟,改善客户体验。

Voximplant 和 Deepgram 将生产级语音 AI 应用于真实通话

实时互动网
实时互动网 · 2025-12-19T03:13:30Z
通过 Amazon Nova Sonic 和 RAG 提升你的英语口语能力

Amazon Nova Sonic 是一个实时语音对话模型,利用 RAG 技术帮助用户练习英语。用户可以上传 PDF 故事,系统提供个性化反馈,提升口语能力,增强语言学习体验。

通过 Amazon Nova Sonic 和 RAG 提升你的英语口语能力

DEV Community
DEV Community · 2025-05-28T09:06:33Z

本文介绍了如何通过前端代码实现实时语音对话助手,利用Azure的实时API,涵盖音频采集、处理和双模态输出,展示语音交互的未来形态,为硬件开发提供基础。

纯前端使用 Azure OpenAI Realtime API 打造语音助手

dotNET跨平台
dotNET跨平台 · 2025-03-05T00:03:40Z
百万tokens仅需8毛,不蒸馏造出世界一流大模型,豆包全新1.5Pro不走捷径

豆包大模型1.5Pro在春节前发布,具备实时语音和视觉理解等多模态能力,性能显著提升且成本低廉,适合日常AI应用。开发者可通过火山引擎轻松调用,推动AI技术落地。

百万tokens仅需8毛,不蒸馏造出世界一流大模型,豆包全新1.5Pro不走捷径

机器之心
机器之心 · 2025-01-23T04:01:13Z

ChatGPT推出了实时语音搜索功能,优化了用户体验,搜索结果呈现多模态信息,逐步向用户开放,并结合天气和股市等数据,提高了搜索的准确性和便利性。

ChatGPT搜索与Her打通了!搜索免费开放,居然还剧透明日直播主题

量子位
量子位 · 2024-12-16T20:27:49Z
🎙️VoiceMath➕:说出、解答、掌握数学!🧠

VoiceMath是一款互动语音数学测验应用,利用AssemblyAI的实时语音转文本API提升学习体验。它提供动态测验、实时语音输入、得分追踪和美观动画,帮助用户提高数学技能。

🎙️VoiceMath➕:说出、解答、掌握数学!🧠

DEV Community
DEV Community · 2024-11-23T04:06:00Z
Microsoft Graph API 用于 Teams 全体大会现已普遍可用

Microsoft Teams支持多种实时语音和视频体验,包括小型会议和大型虚拟活动。通过Microsoft Graph提供的API,开发者可以方便地调度和管理在线会议。现在,Teams全体大会API已正式发布,可用于构建自定义应用程序来同步数据、创建/更新/删除全体大会以及发送邮件通知。

Microsoft Graph API 用于 Teams 全体大会现已普遍可用

Microsoft 365 Developer Blog
Microsoft 365 Developer Blog · 2024-09-06T15:00:02Z

SiMay远程控制管理系统是一个用于Windows系统的远程控制解决方案,具备多种功能,如远程桌面、文件管理、实时语音、实时摄像头等。它使用C#/.net、HOOK技术、WebSocket Web端监控等技术。

一个C#开源远程控制解决方案,非它莫属

dotNET跨平台
dotNET跨平台 · 2024-01-30T00:00:18Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码