小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Seed 全双工语音大模型发布:懂倾听、抗干扰,走向更自然的交互

字节跳动推出的全双工语音大模型Seeduplex,提升了语音交互的自然性和流畅度,具备精准抗干扰和动态判停能力,能在复杂环境中有效理解用户意图,降低误回复和误打断率。该模型已在豆包App上线,提供高质量实时语音体验。

Seed 全双工语音大模型发布:懂倾听、抗干扰,走向更自然的交互

实时互动网
实时互动网 · 2026-04-09T06:11:12Z
Agent 语音交互如何更稳、更快?一次高并发消息链路优化实践

随着大语言模型和语音技术的发展,AI Agent 实现了语音交互,但在高并发场景下,消息链路成为瓶颈。本文探讨如何利用阿里云 RocketMQ LiteTopic 构建高效的实时语音消息架构,以满足海量会话管理、低延迟和会话隔离的需求。

Agent 语音交互如何更稳、更快?一次高并发消息链路优化实践

实时互动网
实时互动网 · 2026-03-27T02:32:22Z
RAVATAR借助Gemini原生音频技术,为AI化身带来更自然的实时语音交互体验

RAVATAR于2026年3月24日宣布,其Genesis AI Avatar Studio集成了Gemini Native Audio,提升了语音交互的自然性和响应速度,满足客户对情感化和即时互动的需求。这一技术基于Google Cloud,扩展了RAVATAR在多个领域的应用,助力企业数字化转型。

RAVATAR借助Gemini原生音频技术,为AI化身带来更自然的实时语音交互体验

实时互动网
实时互动网 · 2026-03-25T06:42:18Z
央视点赞千问APP,“AI办事”让人工智能走进日常生活

央视点赞千问APP,推动AI办事进入日常生活。该APP通过语音交互满足个性化需求,受到大众,尤其是老年群体的欢迎。春节期间,1.3亿人体验AI下单,显示中国在AI办事领域处于全球领先地位。

央视点赞千问APP,“AI办事”让人工智能走进日常生活

量子位
量子位 · 2026-03-07T08:40:25Z

Aqara推出全球首款搭载原生Siri的智能中控屏S1 Plus,集成灯光、温度控制等功能,支持语音交互和设备管理,具备个性化展示及安防视频流功能。

派早报:Aqara 发布集悦妙控屏 S1 Plus Siri 版等

少数派
少数派 · 2026-03-06T00:45:33Z
广和通发布新一代AI智能收银机解决方案

广和通在2026年世界移动通信大会上推出新一代AI智能收银机解决方案,基于联发科技平台,具备强大的硬件扩展性和大模型接入能力,支持智能语音交互、实时库存预测及视觉识别,运行Android 15操作系统。

广和通发布新一代AI智能收银机解决方案

全球TMT-美通国际
全球TMT-美通国际 · 2026-03-04T08:30:22Z
Swipey AI 推出专注于个性化数字互动的交互式 AI 伴侣平台

Swipey AI推出了一个个性化的交互式AI伴侣平台,用户可以与AI角色进行文字和语音对话,调整其属性,享受沉浸式体验。平台注重隐私和用户控制,并提供分级访问。

Swipey AI 推出专注于个性化数字互动的交互式 AI 伴侣平台

实时互动网
实时互动网 · 2026-02-12T06:14:47Z
一条不存在的 AI耳机广告,为什么惊动 OpenAl总裁?

OpenAI计划于2026年推出首款硬件产品,可能包括耳机和笔,旨在通过语音交互提升用户体验。该产品与苹果团队合作设计,风格简约。近期一条假广告引发热议。

一条不存在的 AI耳机广告,为什么惊动 OpenAl总裁?

爱范儿
爱范儿 · 2026-02-10T07:57:42Z

我正在开发一个纯 Rust、零依赖的音频 AI 推理框架 lele,专注于语音交互,支持高效的模型编译与优化,并提供多种音频特征提取功能。

lele: Rust 把 ONNX 模型编译成机器码的 AI 框架

Rust.cc
Rust.cc · 2026-01-28T06:40:09Z
ABR 完成种子轮融资,旨在利用 TSP1 边缘芯片扩展设备端语音 AI 应用

Applied Brain Research(ABR)完成种子轮融资,开发TSP1芯片及边缘AI软件,旨在实现低功耗、高性能的语音交互,解决云端依赖带来的延迟和隐私问题,适用于增强现实和机器人等领域,功耗低于30毫瓦。

ABR 完成种子轮融资,旨在利用 TSP1 边缘芯片扩展设备端语音 AI 应用

实时互动网
实时互动网 · 2026-01-13T03:47:14Z
别被假消息误导:OpenAI 新物种不是 PIN 而是笔!供应链撤离中国转投越南,立讯精密出局背后,揭秘 Jony Ive 操刀的真实意图与代工博弈|AI Pen、OpenAI 硬體、Jony Ive

OpenAI计划推出一款名为“O-Pen”的硬件设备,外形类似笔,由富士康生产,预计支持音频大模型,旨在提升语音交互体验。

别被假消息误导:OpenAI 新物种不是 PIN 而是笔!供应链撤离中国转投越南,立讯精密出局背后,揭秘 Jony Ive 操刀的真实意图与代工博弈|AI Pen、OpenAI 硬體、Jony Ive

硕鼠的博客站
硕鼠的博客站 · 2026-01-08T00:54:52Z
14% 的信号:为何你需要为语音 AI 浪潮做好准备

自2022年ChatGPT推出以来,企业在AI部署上有所进展,但缺乏战略规划。语音交互成为主要方式,14%的用户更倾向于使用语音而非键盘。企业应投资音频设备,以提升语音识别能力,推动AI的广泛应用。

14% 的信号:为何你需要为语音 AI 浪潮做好准备

实时互动网
实时互动网 · 2026-01-05T02:28:35Z

谷歌推出了改进版的Gemini 2.5 Flash Native Audio,增强了语音交互能力,提供更精准的指令执行和更流畅的对话体验,同时支持70多种语言的实时语音翻译,用户可在Google Translate应用中体验这一功能。

改进版Gemini音频模型,带来强大的语音体验

Google DeepMind Blog
Google DeepMind Blog · 2025-12-12T17:50:50Z

S2R技术通过直接理解语音中的用户意图,避免了传统语音转录的局限,提升了搜索准确性和用户体验。该技术在多语言环境中表现出色,适用于智能助手和车载系统,推动语音交互的包容性与人性化。

语音搜索的范式革命:Google S2R如何跳过“文字“这个中间商赚差价

dotNET跨平台
dotNET跨平台 · 2025-10-18T00:01:09Z
Windows 11 大更新:动嘴就能让 AI 操控电脑,还有 Manus 强势上岗

微软宣布将通过AI重写Windows 11,推出Copilot功能,支持语音交互、屏幕识别和多平台数据连接,用户可通过自然语言指令提升工作效率,但需关注隐私问题。

Windows 11 大更新:动嘴就能让 AI 操控电脑,还有 Manus 强势上岗

爱范儿
爱范儿 · 2025-10-17T09:00:53Z
超级App vs 独立操作系统:山姆·奥特曼的野心远不止取代搜索,52分钟发布会暴露其真正想颠覆的是整个应用平台|ChatGPT OpenAI Sam Altman Operating System

OpenAI开发者日展示了山姆·奥特曼的愿景,ChatGPT将成为以自然语言和语音交互为核心的操作系统。同时,OpenAI推出全栈生态,支持开发者变现,推动行业进步。

超级App vs 独立操作系统:山姆·奥特曼的野心远不止取代搜索,52分钟发布会暴露其真正想颠覆的是整个应用平台|ChatGPT OpenAI Sam Altman Operating System

硕鼠的博客站
硕鼠的博客站 · 2025-10-08T00:47:41Z
神州泰岳avavox大模型语音机器人实现轻量化革新

avavox是神州泰岳的创新产品,旨在提升语音交互技术。其特点包括快速搭建、按秒计费、支持多语言和方言识别,具备高反应速度和稳定性,支持线上签约和发票,目标是全球市场拓展。

神州泰岳avavox大模型语音机器人实现轻量化革新

全球TMT-美通国际
全球TMT-美通国际 · 2025-09-24T08:01:57Z
苹果2025年自然语言与交互系统研讨会

自然语言处理(NLP)是人工智能的一个重要领域。苹果最近举办了研讨会,讨论了语音交互系统、大型语言模型训练和语言代理,强调了隐私、安全和效率的关键性。

苹果2025年自然语言与交互系统研讨会

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-23T00:00:00Z

小爱音箱是小米推出的智能音箱,类似于亚马逊Echo,具备查询信息、播放音频和智能家居控制功能。虽然最初计划用它连接家居设备,但发现直接安装止逆阀更为简单。其语音交互自然,我每天早上用它收听广播。

小爱音箱

xulihang's blog
xulihang's blog · 2025-09-09T11:50:50Z
如何使用 Amazon Nova Sonic 和 WebSockets 构建完整的语音对话系统

随着人工智能的发展,语音交互技术正向自然对话演进。Amazon Nova Sonic通过单一模型实现语音理解与生成,解决了传统系统的延迟和信息丢失问题。其优势包括端到端处理、实时双向交互、多语言支持和情感感知,提升用户体验。MCP协议为工具调用提供标准化框架,增强实时对话的准确性和流畅性。

如何使用 Amazon Nova Sonic 和 WebSockets 构建完整的语音对话系统

实时互动网
实时互动网 · 2025-08-18T03:52:50Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码