小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨了大型视觉-语言模型(LVLM)在处理非英语输入时的不足。通过多阶段实验,提出了优化多语言训练策略的关键洞察,发现使用25-50%的非英语数据可以显著提升多语言性能,并引入新基准任务以增强图像中文本理解能力。

Centurio: Drivers of Multilingual Ability in Large Vision-Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

本研究提出了一种新的多语言训练范式LDP,旨在提升多语言视觉信息提取模型在非英语场景中的表现。通过有效利用单语预训练数据,LDP增强了跨语言泛化能力。实验结果表明,LDM模型在各项评估中超越了现有模型,并在单语言基准测试中表现出竞争力。

Language Decoupled Pretraining: Generalizing Multilingual Visual Information Extraction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z

本研究提出Marco-LLM,通过大规模多语言训练,提升低资源语言在多语言任务中的表现,缩小了高资源语言与低资源语言之间的性能差距。

Marco-LLM: Achieving Cross-Language Enhancement through Large-Scale Multilingual Training

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本文探讨了利用单一声学模型进行多语言训练,以提升低资源语言的自动语音识别(ASR)性能。研究表明,多语言训练的ASR模型在51种语言上优于单语言训练,尤其在低资源语言方面。提出的多种模型和方法,如METHODNS和MC-SA-ASR,显著提高了多语言和低资源语音识别的效果。此外,研究介绍了MSR-86K语料库,为多语言ASR研究提供了新的数据支持。

MSA-ASR:利用冻结的ASR模型进行高效多语种说话人归属

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

本研究探讨了跨语言大型语言模型在情感识别中的表现,发现其存在英语中心主义倾向,未能有效捕捉文化情感细微差别。研究提出多语言训练策略,强调中间层特征对情感信息的重要性,并展示了大型语言模型在资源匮乏语言中的应用潜力。实验结果表明,集成模型在情感检测中表现优异,推动了情感认知能力的提升。

跨语言情感检测的大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

本文研究了在低资源环境下提高自动语音识别(ASR)和语音翻译性能的方法。通过多语言训练和预训练声学模型,显著提升了识别精度,尤其是对低资源语言。同时探讨了知识蒸馏和自监督学习等技术,以优化模型并降低训练数据需求。

面向低资源自动语音识别的多语言多模态模型的参数高效适应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

本文探讨了利用单一声学模型进行多语言训练,以提升低资源语言的自动语音识别(ASR)性能。研究表明,多语言训练的ASR模型在51种语言上优于单语言训练,尤其对低资源语言效果显著。该研究为语音识别和翻译等应用提供了新的可能性。

提升音频语言模型在低资源语言和指令遵循能力上的表现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z

本文探讨了提高低资源语言自动语音翻译质量的方法,研究表明高资源语言的ASR模型训练能有效提升翻译质量。预训练模型的词错误率是关键因素,数据增强与预训练互补。此外,提出了多语言训练的ASR模型,显著提高低资源语言的识别性能,并介绍了新的评价指标和语料库,推动多语言语音识别研究的发展。

规范化中遗失了什么?探索多语言自动语音识别模型评估中的陷阱

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z

本文介绍了GigaSpeech语音识别语料库,包含多领域的高质量音频,提供训练子集和新对齐管道。研究表明,基于GigaSpeech 2的模型在低资源语言上显著提高了识别性能,降低了词错误率。同时,探讨了多语言训练对低资源语言ASR的优势,并展示了多种语言的基准测试结果。

MSR-86K:一个包含 86,300 小时语音转换文本的多语种演变语料库,用于语音识别研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-26T00:00:00Z

近年来,自我监督学习在语音处理领域取得显著进展。本文提出了 Fast-HuBERT 方法,通过优化计算成本,缩短了训练时间并提升了速度。同时,研究探讨了多语言训练与自监督学习结合的方法,显著提高了低资源自动语音识别(ASR)的性能。实验结果表明,该方法在多种语言上优于标准 HuBERT,并节省了大量有监督训练数据。

mHuBERT-147:一种紧凑的多语言 HuBERT 模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码