小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了Speech-FT策略,通过模型合并解决微调语音表示模型时的泛化能力下降问题,提供了一种高效的解决方案。

Speech-FT: A Fine-Tuning Strategy for Speech Representation Models that Balances Generalization Ability

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

本研究提出了一种新方法,将自监督语音表示与大语言模型结合,以提升多模态处理和语音理解,显示出在保留语音语义内容方面的优势。

基于大语言模型的语音查询文本翻译:SparQLe

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z

本研究提出了一种语音表示净化与监督增强框架(SRPSE),有效消除音色和节奏等无关因素对语音转文本翻译的负面影响,显著提升翻译效果,尤其在无文本转录条件下表现优异。

Representation Purification for End-to-End Speech Translation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本研究提出JOOCI框架,通过独立建模内容和表达方式信息,优化语音表示技术,提升语音表征和特征构建能力。实验结果表明,JOOCI在SUPERB基准测试中表现优于其他模型。

JOOCI:一种学习综合语音表征的框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-14T00:00:00Z

该研究使用大规模扩散模型进行无领域特定建模的语音合成,通过跨注意机制和预测语音表示总长度来解决文本-语音对齐问题,并在语音的潜在空间中结合语义引导进行提升。实验证明该模型具有与最先进的TTS模型相媲美的零-shot性能。

DiTTo-TTS:高效可扩展的零样本文本到语音系统基于扩散 Transformer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码