小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
云栖发布:从级联到端到端语音翻译大模型Gummy

通义实验室语音团队和自然语言处理团队联盟在2024年云栖大会上推出了端到端语音翻译大模型Gummy,支持多语言实时翻译,翻译延迟低于0.5秒。Gummy还具备多语言混翻、术语干预与领域提示等商业化能力,解决语言障碍和多语言交流需求。

云栖发布:从级联到端到端语音翻译大模型Gummy

实时互动网
实时互动网 · 2024-09-19T11:24:46Z

本文比较了不同的无自回归(NAR)建模方法,发现NAR模型可以在序列中生成多个输出,具有在实时应用中的潜力。同时,该研究在自动语音识别领域发现了一些有趣的性能差距,并展示了结合这些技术来提高精度并应用于无自回归端到端语音翻译的能力。

NARRepair: 自动程序修复的非自回归编码生成模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-24T00:00:00Z

本文介绍了一种改进的多任务学习方法,通过缓解长度和表征的差异来弥合模态间的差距,已在端到端语音翻译中取得显著改进。实验证明该方法达到了最先进的结果,并在使用额外数据时取得了新的最先进结果。

重思和改进端到端语音翻译的多任务学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-07T00:00:00Z

该研究介绍了如何在端到端语音翻译中引入目标语言上下文,以增强连贯性并克服扩展音频片段的内存限制。同时,提出了上下文丢弃以确保对上下文缺失的鲁棒性,并通过添加说话者信息进一步提高性能。研究表明,上下文信息主要有助于捕捉上下文风格,并解决指代和命名实体问题。

通过利用目标语言上下文提升端到端会话语音翻译

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-27T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码