小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
2026年国际声学、语音与信号处理会议(ICASSP)

苹果将在2026年国际声学、语音与信号处理会议(ICASSP)上展示新研究,会议定于5月4日至8日在西班牙巴塞罗那举行。苹果再次赞助该会议,汇聚信号处理及其应用领域的科研和工业界。

2026年国际声学、语音与信号处理会议(ICASSP)

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-30T00:00:00Z
亚马逊在产品页面上推出 AI 语音对话功能

亚马逊推出了新的AI功能“加入聊天”,用户可以实时向卖家提问并获得语音回复,旨在节省顾客时间并提供关键产品信息,模拟与实体店员工的对话体验。用户可通过“收听亮点”按钮获取产品简介,并通过文字或语音提问。这项功能是亚马逊AI购物工具的一部分,旨在提升购物体验。

亚马逊在产品页面上推出 AI 语音对话功能

实时互动网
实时互动网 · 2026-04-29T03:23:02Z
AI语音代理如何应对客户需求高峰

2026年,电话仍是客户体验的重要环节。Metrigy的调查显示,59.1%的消费者愿意尝试AI语音助手,前提是能够转接人工客服。eHealth的AI助手Alice在处理医疗保险来电时表现优异,客户满意度达到77%。Alice通过提供同理心和高效服务提升了客户体验,并减少了通话时长。eHealth计划进一步扩展Alice的功能,以支持更多健康保险选择。

AI语音代理如何应对客户需求高峰

实时互动网
实时互动网 · 2026-04-29T02:32:50Z
OpenMOSS发布MOSS-Audio:一个用于语音、声音、音乐和时间感知音频推理的开源基础模型

MOSS-Audio是一个开源音频理解模型,集成了语音转录、情感分析和环境声音理解等功能。其模块化设计包括音频编码器和大型语言模型,采用DeepStack跨层特征注入和时间感知表示技术,显著提升了音频处理能力。MOSS-Audio-8B-Thinking在音频理解基准测试中表现优异,准确率达到71.08%。

OpenMOSS发布MOSS-Audio:一个用于语音、声音、音乐和时间感知音频推理的开源基础模型

实时互动网
实时互动网 · 2026-04-28T03:00:32Z
OpenClaw v2026.4.25更新:语音角色、TTS升级中文顺畅、插件加速

OpenClaw于2026年4月25日进行了重要更新,提升了AI语音合成能力,增加了语音人格化功能,使声音更自然、情感丰富。优化了插件系统,确保快速启动和稳定更新,监控系统实现透明化以保护隐私。简化了安装流程,降低了出错风险。整体上,OpenClaw从实验性工具升级为稳定的工程化平台,显著提升用户体验。

OpenClaw v2026.4.25更新:语音角色、TTS升级中文顺畅、插件加速

极道
极道 · 2026-04-27T22:04:00Z
Betterness 筹集250万美元,用于推出语音优先的自主 AI 生活教练平台

AI健康平台Betterness完成250万美元种子轮融资,推出全自动语音AI生活指导系统Bett-i。该系统通过主动监测用户健康,提供个性化建议,并整合多种健康数据源。Betterness致力于构建连接开发者、企业和医疗服务提供商的生态系统,推动健康服务的智能化和自动化。

Betterness 筹集250万美元,用于推出语音优先的自主 AI 生活教练平台

实时互动网
实时互动网 · 2026-04-27T03:32:08Z
OpenClaw v2026.4.24更新:DeepSeek V4双模型、语音直达智能体和浏览器自动化升级

OpenClaw 2026.4.24版本更新了语音通话功能,支持完整智能体,提升用户体验。新增DeepSeek V4 Flash和Pro模型,优化快速响应和复杂任务处理。浏览器自动化能力增强,支持坐标点击和更长操作预算。Google Meet集成简化会议管理,系统整体更轻便、稳定,适合各种用户需求。

OpenClaw v2026.4.24更新:DeepSeek V4双模型、语音直达智能体和浏览器自动化升级

极道
极道 · 2026-04-25T22:32:00Z
参加全国大学生智能汽车竞赛需要的CSK5062离线语音控制资源上手指引

第21届全国智能汽车竞赛中,参赛者需使用CSK5062芯片控制电子红绿灯的语音识别和LED显示。文章介绍了芯片特性、SDK获取、开发流程及示例,支持离线语音识别和自定义命令词,开发者可通过官方文档获取详细指导。

参加全国大学生智能汽车竞赛需要的CSK5062离线语音控制资源上手指引

分享AI芯片开发经验
分享AI芯片开发经验 · 2026-04-24T10:30:56Z
面壁智能 SuperMate 升级:智能座舱正在从语音助手走向端侧 Agent丨北京车展

智能座舱的升级使其从传统语音助手转变为复杂的车载Agent,能够理解用户偏好并主动服务。面壁智能的SuperMate方案强调全场景服务和多模态交互,提升用户体验。新功能包括事故处理和儿童安全监测,旨在提供低干扰的智能服务。未来,汽车将成为具备AI能力的智能终端,连接用户生活与出行。

面壁智能 SuperMate 升级:智能座舱正在从语音助手走向端侧 Agent丨北京车展

爱范儿
爱范儿 · 2026-04-24T09:44:49Z
Sanas收购Tomato.ai,旨在提升电信行业的实时语音AI水平

Sanas收购Tomato.ai,进一步拓展语音技术业务,旨在将实时语音智能嵌入全球通信系统。这是Sanas在不到两年内的第三次收购,反映出语音AI在外包行业的整合趋势。收购后,Tomato.ai将领导Sanas的全球电信战略,推动语音AI向系统级集成转变,提升客户体验。

Sanas收购Tomato.ai,旨在提升电信行业的实时语音AI水平

实时互动网
实时互动网 · 2026-04-23T03:43:08Z
Adobe 和 Speechmatics 为 Premiere 提供“云级”的设备端语音识别功能

Adobe 扩大与 Speechmatics 的合作,为 Premiere 提供本地语音识别功能,确保高精度转录并保护隐私。新模型在设备端实现接近云端的准确度,处理速度快,适用于各种硬件,满足安全和隐私需求,支持不同环境中的无缝工作。

Adobe 和 Speechmatics 为 Premiere 提供“云级”的设备端语音识别功能

实时互动网
实时互动网 · 2026-04-22T03:35:11Z

谷歌推出了“持续对话”功能,用户可以在首次请求后继续与Gemini语音助手对话。只需在Google Home应用中启用此功能,即可享受更流畅的互动体验。

通过持续对话,让与Gemini语音助手的交流更加自然高效

The Keyword
The Keyword · 2026-04-21T16:00:00Z
Clerk Chat 更名为 Clerk AI,加倍投入面向企业大规模语音和消息传递的对话式 AI 代理

Clerk AI于2026年4月20日更名,专注于为效果营销构建对话式AI代理。该平台支持智能语音和消息代理的大规模部署,能够进行个性化沟通并与CRM系统集成,提升潜在客户转化率,推动客户互动的未来发展。

Clerk Chat 更名为 Clerk AI,加倍投入面向企业大规模语音和消息传递的对话式 AI 代理

实时互动网
实时互动网 · 2026-04-21T10:00:25Z
xAI推出独立的Grok语音转文本和文本转语音API,目标用户为企业语音开发人员

埃隆·马斯克的 AI 公司 xAI 发布了两款音频 API:语音转文本(STT)和文本转语音(TTS)。STT 支持 25 种语言,提供实时和批量转录,错误率为 5.0%。TTS 支持 20 种语言,提供多种声音选择,定价为每百万字符 4.20 美元。这标志着 xAI 进军语音 API 市场。

xAI推出独立的Grok语音转文本和文本转语音API,目标用户为企业语音开发人员

实时互动网
实时互动网 · 2026-04-20T03:19:00Z
【2026 AI硬件开发学习必看系列】快速通过MCP让你的桌面宠物学会摇尾巴(语音控制舵机)

本文介绍了如何使用MCP工具通过语音指令控制LS26(Arcs-mini)开发板上的MG90S舵机。用户可以通过四次点击按钮启动或停止舵机旋转,并通过云端调用MCP工具设置旋转方向和速度。教程包括硬件接线、代码实现及常见问题解决方案,适合初学者。

【2026 AI硬件开发学习必看系列】快速通过MCP让你的桌面宠物学会摇尾巴(语音控制舵机)

分享AI芯片开发经验
分享AI芯片开发经验 · 2026-04-17T12:20:45Z
【2026 AI硬件开发学习必看系列】通过MCP给AI语音助手加上温湿度测量播报功能

本文介绍了如何使用MCP工具为AI语音助手添加温湿度测量功能。以LS26开发板为例,教程指导用户通过语音指令控制I2C通信,读取AHT10传感器数据,并实时反馈环境温湿度。用户将学习配置MCP工具和编写驱动,实现语音与传感器数据的交互。

【2026 AI硬件开发学习必看系列】通过MCP给AI语音助手加上温湿度测量播报功能

分享AI芯片开发经验
分享AI芯片开发经验 · 2026-04-17T11:16:56Z
内存价格、WebRTC 与语音 AI 的未来

AI的崛起导致内存价格暴涨3至6倍,影响WebRTC和语音AI的功能。内存需求增加,特别是在高分辨率和新编码器下,优化变得必要。未来两年,内存产能改善与需求增长将共同影响科技发展。

内存价格、WebRTC 与语音 AI 的未来

实时互动网
实时互动网 · 2026-04-17T06:54:00Z
Schmooze推出语音AI配对助手“Riya”,以解决滑动交友疲劳问题

Schmooze推出了AI语音配对工具“Riya”,通过对话了解用户个性,推荐更合适的伴侣,超越传统滑动交友方式。该平台已吸引30万用户,预计到2030年印度约会市场将达14.2亿美元。Schmooze利用AI技术提升用户体验,旨在解决在线约会中的匹配难题。

Schmooze推出语音AI配对助手“Riya”,以解决滑动交友疲劳问题

实时互动网
实时互动网 · 2026-04-16T03:52:04Z
Cloudflare 为 AI 代理添加实时语音功能

Cloudflare 为其 AI Agent SDK 引入语音功能,支持实时对话,通过 @cloudflare/voice 包实现语音输入和文本转语音。开发者可以利用持久对象基础架构保持对话历史,并通过 WebSocket 连接实现低延迟交互,旨在提供更自然的多模态 AI 体验。

Cloudflare 为 AI 代理添加实时语音功能

实时互动网
实时互动网 · 2026-04-16T03:40:57Z
Google AI 发布 Gemini 3.1 Flash TTS:表现力强、可控性高的 AI 语音技术新标杆

谷歌推出了Gemini 3.1 Flash TTS,这是一个改进的文本转语音模型,支持70多种语言,具备自然语言音频标签和多说话人对话功能。该模型在行业基准测试中得分1211,提供复杂的控制层,允许开发者根据场景调整语气、语速和口音。同时,集成的SynthID水印技术可识别AI生成内容,确保信息透明。

Google AI 发布 Gemini 3.1 Flash TTS:表现力强、可控性高的 AI 语音技术新标杆

实时互动网
实时互动网 · 2026-04-16T03:02:56Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码