小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
OpenClaw v2026.4.26大清洗版本:插件重写性能提升、一键加密与迁移

OpenClaw v2026.4.26版本进行了全面升级,重写的插件系统显著提升了性能,实时语音对话功能实现低延迟通话。新系统支持灵活选择本地与云端模型,优化用户体验。同时引入一键加密,确保数据传输安全,迁移工具简化了用户从其他平台的迁移过程,整体提升了系统的稳定性和易用性。

OpenClaw v2026.4.26大清洗版本:插件重写性能提升、一键加密与迁移

极道
极道 · 2026-04-28T06:09:00Z
现在您可以通过苹果的CarPlay使用ChatGPT

苹果的iOS 26.4更新允许用户通过CarPlay与ChatGPT进行语音对话。该应用仅支持语音交流,符合苹果的开发者指南,用户可以查看最近的对话,但需手动打开应用,无法使用唤醒词。

现在您可以通过苹果的CarPlay使用ChatGPT

The Verge
The Verge · 2026-03-31T21:03:18Z

谷歌推出Gemini 3.1 Flash Live,增强语音对话能力,支持开发者和企业构建复杂任务的语音代理。该模型在自然对话和多语言支持方面表现出色,能够更好地理解用户情绪,提供快速自然的响应。

Gemini 3.1 Flash Live:让音频人工智能更加自然和可靠

The Keyword
The Keyword · 2026-03-26T15:21:00Z
NVIDIA发布PersonaPlex-7B-v1:专为自然全双工对话设计的实时语音到语音模型

NVIDIA 发布了 PersonaPlex-7B-v1,这是一个全双工语音对话模型,采用单一 Transformer 架构,支持自然语音交互、插话和重叠对话。该模型通过双流配置处理用户音频和智能体语音,结合真实与合成对话进行训练,评估结果显示其在对话动态和任务遵守方面表现优异。

NVIDIA发布PersonaPlex-7B-v1:专为自然全双工对话设计的实时语音到语音模型

实时互动网
实时互动网 · 2026-01-19T02:55:40Z
OpenAI希望在首款硬件设备发布前,让ChatGPT的声音更接近人类语音

OpenAI计划在2026年前推出升级版音频模型,以提升语音对话的自然性和准确性,并重组团队专注于音频AI。同时,将发布智能眼镜和无显示屏音箱等音频设备。

OpenAI希望在首款硬件设备发布前,让ChatGPT的声音更接近人类语音

实时互动网
实时互动网 · 2026-01-05T06:33:58Z
微软为Copilot AI赋予可聊天的人脸

微软推出名为“Portraits”的实验功能,为Copilot添加40种风格化人类头像,旨在提升语音对话的自然性。用户可选择头像并配对声音,增强与聊天机器人的互动。该功能目前在美国、英国和加拿大的18岁及以上用户中可用。

微软为Copilot AI赋予可聊天的人脸

The Verge
The Verge · 2025-09-30T17:12:48Z

谷歌电视推出Gemini,用户可通过语音与电视自然对话,轻松获取娱乐内容和学习帮助。Gemini支持家庭活动、学校项目和技能学习,提供视频支持。目前已在TCL QM9K系列上推出,未来将扩展至更多设备。

Gemini登陆谷歌电视

The Keyword
The Keyword · 2025-09-22T16:00:00Z

本研究探讨了语音对话中声音反馈(如“嗯”、“是的”、“好吧”)的感知韵律相似性。结果表明,光谱和自监督语音表征在编码韵律方面优于音高特征,尤其在同一说话者的反馈中,通过对比学习可进一步优化这些表征。

Representation of Perceived Prosodic Similarity of Conversational Feedback

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z
亚马逊Nova Sonic语音对话AI

亚马逊Nova Sonic是一款先进的语音对话模型,支持实时人声交流,具有低延迟和高性价比。它提供双向流API,允许开发者创建自然的AI代理,支持多种声音和口音,适用于知识库查询和工具调用,并通过WebSockets实现自然对话。Python SDK虽为实验性,但涵盖基本功能,开发者可通过创建客户端和事件处理函数进行使用。

亚马逊Nova Sonic语音对话AI

DEV Community
DEV Community · 2025-05-16T18:19:59Z

最近更新了语音对话功能,采用Azure语音服务和BotSharp框架进行对话管理。树莓派适合Linux系统开发,支持语音识别与合成。希望大家尝试这些技术,AI行业快速发展,国产大模型不断进步。

结合BotSharp智能体框架开发语音交互

dotNET跨平台
dotNET跨平台 · 2025-03-27T23:58:30Z

微软发布了Windows 11的Copilot测试版,新增语音对话快捷键Alt + 空格键,按住2秒可启动对话,ESC键结束,旨在提升用户在处理文档时的工作效率。

微软发布Copilot for Windows 11测试版支持通过快捷键进行语音对话

蓝点网
蓝点网 · 2025-03-21T16:38:27Z

昆仑万维的「天工大模型4.0」o1版和4o版于2025年1月6日上线,用户可免费使用。o1版具备强大的逻辑推理能力,支持数学和代码等任务;4o版则为多模态模型,提供自然流畅的语音对话体验。这一技术升级提升了推理效率和准确性,标志着向通用人工智能迈进的重要一步。

「天工大模型4.0」o1版和4o版正式上线天工APP和网页 免费使用

量子位
量子位 · 2025-01-06T03:36:23Z

国产AI助手Skyo基于天工大模型4.0,具备实时语音对话能力,能够灵活应对话题切换和中英文交流,情感理解和个性化记忆功能提升用户体验,表现出色。

国产4o大模型,秒懂国风李子柒

量子位
量子位 · 2024-11-20T05:51:55Z
实测昆仑万维对话AI「Skyo」,会读诗、知晓雷军摆拍

OpenAI的GPT-4o与谷歌的Gemini Live在AI实时语音对话领域竞争激烈。昆仑万维的Skyo助手具备快速响应和情感化反应等功能,表现优异。尽管Skyo仍需改进,但其在语音交互中展现了强大能力,未来将继续扩展功能,推动多模态AI应用的发展。

实测昆仑万维对话AI「Skyo」,会读诗、知晓雷军摆拍

机器之心
机器之心 · 2024-11-20T05:25:17Z
Perplexity ai 的 Mac 版初体验

Mac应用版相比网页版增加了许多快捷键,使用更便捷,尤其是“文件上传”功能。语音对话功能暂时不需要。

Perplexity ai 的 Mac 版初体验

happy xiao
happy xiao · 2024-10-26T02:34:25Z
OpenAI 实时 API 闪亮登场

OpenAI在旧金山的DevDay活动中推出了四个新版本的应用开发产品,重点是新的实时API公测版。该API支持开发者创建与AI聊天机器人的互动应用。新模型包括GPT-4o和GPT-o1,支持语音生成和自然语音对话。OpenAI计划增加视觉和视频功能,并提高API的会话限制。实时API现已开放给开发者测试。

OpenAI 实时 API 闪亮登场

The New Stack
The New Stack · 2024-10-02T04:05:12Z

小米公司回应用户关于智能摄像机的疑问,表示相关视频中无人访问,设备状态正常。摄像机具备声音回声消除功能,未遭网络攻击,语音对话通过米家App加密通道进行。小米重视用户隐私,严格遵循安全标准,确保产品安全。

小米回应摄像头里出现陌生男子说话

月光博客
月光博客 · 2024-09-15T14:38:00Z

OpenAI宣布ChatGPT for Mac客户端全面开放,提供模型选择、对话记录、预设提示词等功能,具有语音对话和搜索功能。已开通ChatGPT Plus订阅的用户将获得更高的配额。Windows版客户端尚未发布。

OpenAI宣布ChatGPT for Mac客户端全面开放 所有用户都可以使用

蓝点网
蓝点网 · 2024-06-26T04:24:31Z

OPENAI宣布ChatGPT将支持语音对话和图像识别功能,语音由文本转语音模型提供支持,图像识别由多模态GPT-3.5和GPT-4提供支持,这些功能将在几周内推出。同时,OPENAI还推出了图像生成模型DALL-E 3,将在10月份与ChatGPT集成。

OPENAI为ChatGPT推出多模态版本 可以语音对话以及识别图像内容

蓝点网
蓝点网 · 2023-09-26T03:42:29Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码