小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Krisp发布语音翻译v3,向开发者开放企业级翻译功能

Krisp推出语音翻译v3,提供企业级语音翻译解决方案和API,准确率达96%。新功能包括自动语言选择、实时通话审核和自定义词汇表,支持61种语言,专为医疗、金融等高风险场景设计,确保翻译质量。开发者可自助使用API,享受60分钟免费试用。

Krisp发布语音翻译v3,向开发者开放企业级翻译功能

实时互动网
实时互动网 · 2026-06-10T03:30:19Z
Google 发布 Gemini 3.5 Live Translate:一款支持 70 多种语言的流式语音翻译音频模型

谷歌推出了Gemini 3.5实时翻译模型,支持70多种语言的语音翻译。该模型采用连续流处理,翻译内容滞后几秒,适用于会议和通话场景。开发者可通过Live API配置功能,支持音频输入和输出,未来将应用于Google Meet和Translate应用中。

Google 发布 Gemini 3.5 Live Translate:一款支持 70 多种语言的流式语音翻译音频模型

实时互动网
实时互动网 · 2026-06-10T02:35:25Z

谷歌推出Gemini 3.5 Live Translate,支持70多种语言的实时语音翻译,自动检测语言并生成自然流畅的翻译语音,适用于会议和通话。该功能在Google Meet和Google Translate应用中逐步推出,提升翻译质量和速度,支持多语言对话,并新增“听模式”,用户可通过手机直接听到翻译内容。

使用Gemini 3.5 Live Translate实现流畅自然的语音翻译

Google DeepMind Blog
Google DeepMind Blog · 2026-06-09T15:16:25Z

谷歌推出Gemini 3.5实时翻译模型,支持70多种语言的语音实时翻译,自动检测语言并生成自然流畅的翻译语音,适用于会议和通话。用户可通过Google Meet和Google Translate应用体验这一新功能,提升多语言沟通效率。

流畅自然的语音翻译:Gemini 3.5实时翻译

The Keyword
The Keyword · 2026-06-09T15:00:00Z
迈向机器翻译:来自人类翻译研究的启示

当前语音翻译系统虽然准确,但缺乏灵活性,无法像人类翻译员那样适应实际情况。为提升其实用性,需要深入理解人类翻译的本质。本文探讨人类翻译文献,提出借鉴人类翻译原则以改进机器翻译系统,推动机器翻译的真正进步。

迈向机器翻译:来自人类翻译研究的启示

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-29T00:00:00Z
DeepL 更新 DeepL Voice,扩展了语言支持并提高了会议效率

DeepL 更新了其实时语音翻译工具 DeepL Voice,新增中文普通话等语言支持,提升会议效率。该工具可在虚拟会议中提供字幕翻译,并支持移动设备的即时语音翻译,更新还包括会议记录和翻译功能,增强企业安全性。

DeepL 更新 DeepL Voice,扩展了语言支持并提高了会议效率

实时互动网
实时互动网 · 2025-07-31T02:09:07Z

谷歌Workspace推出新功能,包括Gmail的个性化智能回复,能够根据用户语气和上下文生成回复;Google Meet提供近实时低延迟语音翻译,支持多语言自然对话;Google Vids现已向订阅用户开放。

了解谷歌Workspace与Gemini的新功能如何在工作和家庭中帮助您。

The Keyword
The Keyword · 2025-05-20T17:45:00Z
谷歌Meet可以将您的话翻译成其他语言

谷歌在Meet中推出了语音翻译功能,利用Gemini技术实时翻译用户对话,保留声音、语调和表达。目前支持英语和西班牙语,未来将增加意大利语、德语和葡萄牙语。该功能仅对AI Pro或AI Ultra计划的用户开放。

谷歌Meet可以将您的话翻译成其他语言

The Verge
The Verge · 2025-05-20T17:13:22Z

本研究提出了一种创新方法,利用大型语言模型提升国际口语翻译研讨会(IWSLT)中的语音翻译与指令跟随任务的性能。通过融合多个自动语音识别系统的输出,采用两步翻译和文档级精炼,显著提高了翻译质量。

KIT's Offline Speech Translation and Instruction Following Submission: IWSLT 2025

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了Soundwave,一种高效的训练策略和新架构,旨在解决语音大型语言模型在语音与文本之间的表示空间差距和序列长度不一致的问题。Soundwave在语音翻译和AIR-Bench任务中表现优异,仅使用五十分之一的训练数据,仍能保持智能对话的表现。

Soundwave: Less is More for Speech-Text Alignment in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

本研究探讨了2024年12月至2025年1月的首次语音翻译指导(SpeechT),旨在填补该领域的指导空白。研究团队提出了一种系统化的方法,以提升语音翻译效果,为未来研究提供参考。

语音翻译中的首次指导成果:SpeechT

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本研究探讨了传统级联语音翻译模型的局限性,并介绍了Google的Translatotron模型。该模型通过直接进行语音到语音的翻译,提高了翻译效率,减少了错误,尤其在弥合非洲语言与其他正式语言的障碍方面表现优异,具有重要的应用前景。

Speech to Speech Translation with Translatotron: A State of the Art Review

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-09T00:00:00Z

本研究提出了一种基于条件计算的特征融合框架,解决了自监督学习特征与传统频谱特征之间的冲突。该框架结合了门控网络和断开策略,提升了模型的鲁棒性和收敛速度。在MUSTC数据集上的语音翻译任务中,我们的方法与频谱模型表现相当。

Optimizing Speech Multi-View Feature Fusion through Conditional Computation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-14T00:00:00Z

本研究提出了一种利用多语言大型语言模型来解决零资源语音翻译和自动语音识别的挑战。通过结合预训练的语音编码器和轻量适配模块,系统在CoVoST2数据集上实现了超过23的BLEU分数和28.2%的错误率。

零资源语音翻译与识别的语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z
语言不仅仅是文字:语音转文本翻译系统是否利用韵律?

本文探讨了韵律对语音翻译中语义和文本翻译的影响,并提出了一种评估韵律意识的方法和基准ContraProSt。研究表明,S2TT模型对韵律有一定的内部表征,但韵律信号对翻译的显著影响有限。E2E系统优于传统级联系统,部分级联系统能够捕捉韵律信息,但效果有限。

语言不仅仅是文字:语音转文本翻译系统是否利用韵律?

Apple Machine Learning Research
Apple Machine Learning Research · 2024-11-26T00:00:00Z

本文研究了在低资源环境下提高自动语音识别(ASR)和语音翻译性能的方法。通过预训练声学模型和结合文本到语音(TTS)技术,利用少量数据实现了显著的性能提升。同时,探讨了文本多样性和合成数据对ASR性能的影响,并提出了有效的模型优化策略。

STTATTS:统一语音转文本和文本转语音模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

本文研究了在低资源环境下提高自动语音识别(ASR)和语音翻译性能的方法。通过多语言训练和预训练声学模型,显著提升了识别精度,尤其是对低资源语言。同时探讨了知识蒸馏和自监督学习等技术,以优化模型并降低训练数据需求。

面向低资源自动语音识别的多语言多模态模型的参数高效适应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

本文探讨了利用LibriSpeech构建多语言平行语料库的方法,适用于语音翻译和口语实验。同时,研究提出了基于大型语言模型的TransAgents框架,以提升文学翻译质量,并通过创新评估策略验证其有效性。

多语种数字版文学作品的自动翻译对齐管道

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

研究表明,在低资源环境下,通过字符级到单词级的转化可以显著提升语音翻译的速度和准确性。使用预训练的声学模型和数据增强技术,有效提高了自动语音翻译的质量。新提出的基于课程学习和互连机制的方法进一步优化了语音特征提取和翻译性能,实验结果显示BLEU分数显著提升。

揭示预训练在直接语音翻译中的作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z

本文介绍了一种多语言端到端语音翻译框架,展示了其在自动语音识别和机器翻译中的有效性。研究表明,预训练语言模型在翻译任务中表现优异,通过多任务学习和新颖的模型设计显著提高了翻译质量和效率,为语音翻译领域设立了新的技术标准。

语言扩展中的任务算术在语音翻译中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码