小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

谷歌推出了Gemini 3.1 Flash Live,这是其最高质量的音频模型,旨在提供更自然、可靠的实时对话。该模型支持开发者通过Gemini Live API使用,企业可用于客户体验,用户可通过Search Live和Gemini Live体验。3.1 Flash Live在理解语调和处理复杂任务方面表现出色,能够在嘈杂环境中提供更自然的对话,所有生成的音频都带有水印,以防止虚假信息传播。

Gemini 3.1 Flash Live:让音频人工智能更加自然和可靠

Google DeepMind Blog
Google DeepMind Blog · 2026-03-26T15:23:35Z
OpenAI希望在首款硬件设备发布前,让ChatGPT的声音更接近人类语音

OpenAI计划在2026年前推出升级版音频模型,以提升语音对话的自然性和准确性,并重组团队专注于音频AI。同时,将发布智能眼镜和无显示屏音箱等音频设备。

OpenAI希望在首款硬件设备发布前,让ChatGPT的声音更接近人类语音

实时互动网
实时互动网 · 2026-01-05T06:33:58Z

谷歌搜索推出Gemini音频模型,用户可通过语音与AI实时对话,获得更自然的回答。只需在谷歌应用中点击Live图标提问,便可享受更好的DIY帮助和学习体验。该功能将在未来一周内向美国用户推出。

现在,您在使用搜索时可以进行更流畅、更富表现力的对话。

The Keyword
The Keyword · 2025-12-12T17:00:00Z
谷歌的Gemini Live AI助手将向您展示它所谈论的内容

谷歌的Gemini Live AI助手即将推出新功能,能够实时与用户互动并高亮显示物品。用户可通过手机摄像头找到所需工具。此外,Gemini Live将与消息、电话和时钟等应用程序集成,允许用户在对话中发送消息或拨打电话。更新的音频模型将改善语音的语调和节奏,使对话更自然。

谷歌的Gemini Live AI助手将向您展示它所谈论的内容

The Verge
The Verge · 2025-08-20T21:58:03Z

Mistral AI发布了Voxtral音频模型,提供24B和3B两个版本,旨在解决语音智能市场的痛点。该模型支持多语言、长文本处理和问答功能,性能优于现有开源模型,成本低,适合多种应用场景,推动语音交互普及。

在线教程丨Mistral AI首个开源音频模型Voxtral,24B与3B版本兼顾多场景语音深度理解

HyperAI超神经
HyperAI超神经 · 2025-07-22T04:09:44Z
刚刚,OpenAI 一口气发布三个新模型!还为此做了一个新网站

OpenAI推出新一代音频模型,具备语音转文本和文本转语音功能,显著提升转录精度和语音风格控制,适用于多种应用场景。该模型在多语言测试中表现优异,定价合理,旨在提升开发者体验和语音交互的情感表达。

刚刚,OpenAI 一口气发布三个新模型!还为此做了一个新网站

爱范儿
爱范儿 · 2025-03-21T00:29:29Z
在API中推出新一代音频模型

2025年3月20日,推出新一代音频模型,提升语音代理的智能和交互能力。新模型具备更精准的语音转文本和文本转语音功能,适用于客户服务和创意叙事等场景,开发者可定制语音风格,增强用户体验,且在多语言环境中表现优异。

在API中推出新一代音频模型

OpenAI
OpenAI · 2025-03-20T11:00:00Z
Hertz-Dev:用于实时对话式 AI 的开源 8.5B 音频模型,在单 RTX 4090 上具有 80 毫秒理论延迟

Standard Intelligence Lab发布了Hertz-Dev,一个开源的85亿参数音频模型,理论延迟为80毫秒,实际延迟为120毫秒,旨在提升实时交互性能。该模型降低了计算需求,适合独立开发者和小型企业,推动AI技术的普及,广泛应用于客户服务和智能家居等领域。

Hertz-Dev:用于实时对话式 AI 的开源 8.5B 音频模型,在单 RTX 4090 上具有 80 毫秒理论延迟

实时互动网
实时互动网 · 2024-11-06T03:52:38Z

本研究使用神经音频编解码器EnCodec生成音频,并学习通用音频模型EncodecMAE,取得了与领先的音频表示模型相媲美或更好的性能。

EnCodecMAE: 利用神经编解码器进行通用音频表示学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码