小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
迈向机器翻译:来自人类翻译研究的启示

当前语音翻译系统虽然准确,但缺乏灵活性,无法像人类翻译员那样适应实际情况。为提升其实用性,需要深入理解人类翻译的本质。本文探讨人类翻译文献,提出借鉴人类翻译原则以改进机器翻译系统,推动机器翻译的真正进步。

迈向机器翻译:来自人类翻译研究的启示

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-29T00:00:00Z
DeepL 更新 DeepL Voice,扩展了语言支持并提高了会议效率

DeepL 更新了其实时语音翻译工具 DeepL Voice,新增中文普通话等语言支持,提升会议效率。该工具可在虚拟会议中提供字幕翻译,并支持移动设备的即时语音翻译,更新还包括会议记录和翻译功能,增强企业安全性。

DeepL 更新 DeepL Voice,扩展了语言支持并提高了会议效率

实时互动网
实时互动网 · 2025-07-31T02:09:07Z

谷歌Workspace推出新功能,包括Gmail的个性化智能回复,能够根据用户语气和上下文生成回复;Google Meet提供近实时低延迟语音翻译,支持多语言自然对话;Google Vids现已向订阅用户开放。

了解谷歌Workspace与Gemini的新功能如何在工作和家庭中帮助您。

The Keyword
The Keyword · 2025-05-20T17:45:00Z
谷歌Meet可以将您的话翻译成其他语言

谷歌在Meet中推出了语音翻译功能,利用Gemini技术实时翻译用户对话,保留声音、语调和表达。目前支持英语和西班牙语,未来将增加意大利语、德语和葡萄牙语。该功能仅对AI Pro或AI Ultra计划的用户开放。

谷歌Meet可以将您的话翻译成其他语言

The Verge
The Verge · 2025-05-20T17:13:22Z

本研究提出了一种创新方法,利用大型语言模型提升国际口语翻译研讨会(IWSLT)中的语音翻译与指令跟随任务的性能。通过融合多个自动语音识别系统的输出,采用两步翻译和文档级精炼,显著提高了翻译质量。

KIT's Offline Speech Translation and Instruction Following Submission: IWSLT 2025

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了Soundwave,一种高效的训练策略和新架构,旨在解决语音大型语言模型在语音与文本之间的表示空间差距和序列长度不一致的问题。Soundwave在语音翻译和AIR-Bench任务中表现优异,仅使用五十分之一的训练数据,仍能保持智能对话的表现。

Soundwave: Less is More for Speech-Text Alignment in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

本研究探讨了2024年12月至2025年1月的首次语音翻译指导(SpeechT),旨在填补该领域的指导空白。研究团队提出了一种系统化的方法,以提升语音翻译效果,为未来研究提供参考。

语音翻译中的首次指导成果:SpeechT

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本研究探讨了传统级联语音翻译模型的局限性,并介绍了Google的Translatotron模型。该模型通过直接进行语音到语音的翻译,提高了翻译效率,减少了错误,尤其在弥合非洲语言与其他正式语言的障碍方面表现优异,具有重要的应用前景。

Speech to Speech Translation with Translatotron: A State of the Art Review

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-09T00:00:00Z

本研究提出了一种基于条件计算的特征融合框架,解决了自监督学习特征与传统频谱特征之间的冲突。该框架结合了门控网络和断开策略,提升了模型的鲁棒性和收敛速度。在MUSTC数据集上的语音翻译任务中,我们的方法与频谱模型表现相当。

Optimizing Speech Multi-View Feature Fusion through Conditional Computation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-14T00:00:00Z

本研究提出了一种利用多语言大型语言模型来解决零资源语音翻译和自动语音识别的挑战。通过结合预训练的语音编码器和轻量适配模块,系统在CoVoST2数据集上实现了超过23的BLEU分数和28.2%的错误率。

零资源语音翻译与识别的语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z
语言不仅仅是文字:语音转文本翻译系统是否利用韵律?

本文探讨了韵律对语音翻译中语义和文本翻译的影响,并提出了一种评估韵律意识的方法和基准ContraProSt。研究表明,S2TT模型对韵律有一定的内部表征,但韵律信号对翻译的显著影响有限。E2E系统优于传统级联系统,部分级联系统能够捕捉韵律信息,但效果有限。

语言不仅仅是文字:语音转文本翻译系统是否利用韵律?

Apple Machine Learning Research
Apple Machine Learning Research · 2024-11-26T00:00:00Z

文章介绍了一种新扩散模型,通过在连续语音表示空间进行前向扩散和在离散语音单位空间进行后向扩散,保留语义结构并结合两种模型。在无文本直接语音翻译任务中,该方法将解码步骤从500减少到50,并取得了相当的效果。

Meta-DiffuB:一种带有元探索的上下文化序列到序列文本扩散模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

本研究提出了一种创新的同步双语联结主义时间分类框架,通过双重 CTC 缩小语音翻译中的模态和语言差距。模型将转录和翻译作为并行目标,提升了音频与文本、源语言与目标语言的连接。在资源有限的情况下,增强的 BiL-CTC+ 变体表现出色,显著提高了语音识别性能,展示了跨语言学习的效果和广泛适用性。

CTC-GMM:用于快速准确流式语音翻译的CTC引导模态匹配

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

本文介绍了一种在语音翻译中使用离散语音单元的自监督学习模型。通过在有限数据上微调,使模型更紧凑,推理更快。相比传统的自动语音识别预训练,该方法无需转录,适合资源有限的环境。在CoVoST-2 X-En数据集上,提升了0.5的BLEU得分,模型大小减半,效果与传统方法相当。

揭示预训练在直接语音翻译中的作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z
摩尔线程正式开源音频理解大模型MooER

摩尔线程开源了音频理解大模型MooER,支持中英文语音识别和中译英语音翻译。MooER-5K在测试中表现优异,特别是在Covost2中译英测试集上,BLEU分数达到25.2。模型结构包括Encoder、Adapter和Decoder三个部分。训练过程中使用了自研的夸娥智算平台和DeepSpeed框架。MooER与其他开源模型相比效果更优。文章提供了一些有关Encoder选择、音频建模粒度和快速适应到目标垂类的建议。

摩尔线程正式开源音频理解大模型MooER

实时互动网
实时互动网 · 2024-08-23T10:09:01Z

该论文研究了英文到台湾闽南语的语音翻译,包括数据收集、建模和发布基准数据集。通过人工注释、数据自动挖掘和伪标注方法,收集了大量数据。在模型训练中,结合自监督离散表示和普通话文本监督,取得了良好效果。最后,推出了一个S2ST基准数据集。

百灵 TTS:面向人类化自然表达的汉语方言语音合成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-01T00:00:00Z

本文研究了使用Whisper作为多语言语音模型示例。通过语音编码器生成的话语表征,保留了一些语言敏感信息,但不同语言的单词映射到相似的语义空间。通过共享的嵌入空间,证明了零-shot跨语言转移在语音翻译中的应用。Whisper在使用英语到中文翻译数据进行微调后,在其他语言的输入话语上表现出性能提升。通过跨语言表示,Whisper可以对预训练过程中未见的语言进行语音翻译。

跨语言迁移学习的语音翻译

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-01T00:00:00Z

通过预训练、知识蒸馏和非自回归训练技术,基于CTC的非自回归模型在直接语音到语音翻译中实现了与自回归模型相当的翻译质量,并提升了26.81倍的解码速度。

基于 CTC 的非自回归式无文字语音翻译

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-11T00:00:00Z

该研究提出了一种改进神经机器翻译在语音翻译中稳健性的方法,通过注入真实输出中的噪声和结合拼音特征进行训练和测试,实验结果表明该方法在多个噪声测试集上表现优异,并在WMT'17中英测试集上取得了泛化性能的提高。

大规模多语言神经机器翻译的鲁棒性实证研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-13T00:00:00Z

本文介绍了一种新颖的语音增强语言模型(SALM),具有多任务和上下文学习能力。SALM在自动语音识别和语音翻译等任务上表现出色,并通过关键词增强任务验证了其零-shot上下文学习能力。作者还提出了语音监督上下文训练方法,进一步提升了模型的上下文学习能力。

PSALM: 基于大型多模型的逐像素分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-21T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码