小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
国产免费2B开源语音模型征服《莽撞人》!复刻郭德纲最难贯口

国产开源语音模型VoxCPM 2成功复刻郭德纲的《莽撞人》,展现高保真、多方言和多语种能力,音质达到CD级别,适用于游戏和影视等领域,吸引了众多用户体验。

国产免费2B开源语音模型征服《莽撞人》!复刻郭德纲最难贯口

量子位
量子位 · 2026-04-08T06:10:06Z
低延迟、多语种、轻量化,Voxtral Realtime 打破 ASR 全场景桎梏;可穿戴设备设计福音!Antenna Performance 构建天线性能与故障数据集

Mistral AI于2026年2月开源了Voxtral Mini 4B Realtime 2602模型,支持13种语言的实时语音转录,延迟低于500毫秒,适合轻量化应用,并可在边缘计算单元上部署,提升语音识别的精度与效率。

低延迟、多语种、轻量化,Voxtral Realtime 打破 ASR 全场景桎梏;可穿戴设备设计福音!Antenna Performance 构建天线性能与故障数据集

HyperAI超神经
HyperAI超神经 · 2026-03-13T08:23:29Z
PaddleOCR-VL-1.5发布问鼎双榜,0.9B小钢炮攻克“曲面”文档!

PaddleOCR于2025年推出PaddleOCR-VL-1.5,具备94.5%精度,支持异形框定位,提升文本行和印章识别能力。该模型在复杂场景中表现优异,已开源,用户可通过官网和API使用。新版本优化了推理速度,支持多语种和跨页表格合并,旨在提升文档解析的准确性和效率。

PaddleOCR-VL-1.5发布问鼎双榜,0.9B小钢炮攻克“曲面”文档!

百度大脑
百度大脑 · 2026-01-29T12:16:02Z
全球沟通零“时差”,腾讯云TRTC 实时翻译AI引擎,全链路助推企业突破“无感”瓶颈

腾讯云推出的AI实时翻译方案,具备毫秒级延迟和多语种支持,提升了用户在直播、电商客服和会议等场景中的交流体验,打破语言障碍。

全球沟通零“时差”,腾讯云TRTC 实时翻译AI引擎,全链路助推企业突破“无感”瓶颈

实时互动网
实时互动网 · 2025-10-21T06:19:02Z

B站推出AI原声翻译功能,提升海外用户体验,支持多语种视频,完美还原UP主声线,解决翻译中的情感与风格保留问题,未来将扩展更多语言。

B站持续完善海外用户产品体验,用户可体验原汁原味多语种视频

量子位
量子位 · 2025-08-01T09:08:10Z

PaddleOCR 3.1 更新了多语种文本识别模型,支持37种语言,识别精度提升30%。新增文档翻译工具PP-DocTranslation,支持Markdown、PDF和图片格式翻译,并支持MCP服务器,便于将OCR能力集成到AI应用中。

PaddleOCR 3.1 发布:文心助力30+语种文字识别精度提升30%+,关键能力支持MCP

百度大脑
百度大脑 · 2025-07-04T11:25:45Z

本研究解决了视觉语言模型(VLM)在处理多语种输入时生成英语回复的限制问题,提出了一种连续的多语种融合策略,在视觉指令调优过程中注入文本多语种数据,从而保留语言模型的多语种能力。研究结果表明,该方法在不影响视觉性能的前提下显著提升了多语言的语言保真度,提供了一个有效的解决方案以推动全球VLM的应用。

通过多语种文本正则化打破视觉语言模型中的语言障碍

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-28T00:00:00Z

本研究提出了一种新方法——多因素平衡ICL(BMF-ICL),旨在解决多语种大型语言模型在上下文学习中因示例选择导致的有效性差异。实验结果表明,BMF-ICL在多个模型上优于现有方法,强调了整合多因素的重要性。

Application of Multi-Factor Balanced In-Context Learning in Multilingual Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本文介绍了博利项目,旨在解决印度语言中口吃语音数据稀缺的问题,构建了多语种口吃语音数据集,包含匿名元数据、问卷回应及朗读、自发言语记录,并详细注释五种口吃类型,为相关研究和技术发展提供了重要资源。

Boli: Understanding Stuttering Experiences and Analyzing Stuttering Speech Dataset

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-27T00:00:00Z
沟通无限,服务无界:科大讯飞携手中国银行四川省分行在天府机场应用多语种AI透明屏

四川中行与科大讯飞合作推出多语种AI透明屏,提升境外游客支付便利性,支持实时翻译,优化金融服务体验。

沟通无限,服务无界:科大讯飞携手中国银行四川省分行在天府机场应用多语种AI透明屏

机器之心
机器之心 · 2024-12-16T06:36:00Z

本研究探讨了多语种自然语言处理中的英语角色,指出其在任务性能与语言理解之间存在目标不一致,建议应重视增强语言理解,而非单纯依赖英语提升任务性能。

Evaluating the Role of English in Multilingual Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z

本文提出了一种基于并行语料库和合成数据增强的策略,旨在提升印度36种语言的机器翻译质量,促进多语种交流。

Bhasha Domain: The Translation Ecosystem of Languages in the Indian Subcontinent

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本研究探讨了多语种检索增强语言模型在处理多样语言时的挑战,提出了《Futurepedia》基准测试,评估六个多语种RALMs,揭示语言资源不均等问题并提出改进建议。

Not All Languages Are Equal: Insights into Multilingual Retrieval-Augmented Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-29T00:00:00Z

本研究探讨了多语种大型语言模型(MLLMs)的开发与应用,提出了优化多语种能力的策略,并分析了技术和文化视角。研究强调支持语言多样性的重要性,指出88.38%的世界语言为低资源,影响超过十亿用户。

Responsible Multilingual Large Language Models: A Survey of Development, Applications, and Societal Impact

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-23T00:00:00Z

本研究探讨了大型语言模型在非英语语言中的信心估计不足问题。通过多语种信心估计(MlingConf)方法,发现英语在语言无关任务中表现优越,而使用相关语言提示可显著提升语言特定任务的信心估计,从而提高模型的可靠性和准确性。

多语种信心估计的综合研究:针对大型语言模型的 MlingConf

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

研究分析了分词对多语种语言模型形态知识的影响,比较了mT5和ByT5在不同语言上的形态学理解。结果表明,中晚层编码的形态信息显著影响模型表现,尤其在处理不规则语言时,增加预训练数据能提升效果。

多语种语言模型中的分词与形态学:mT5与ByT5的比较分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-15T00:00:00Z

本研究提出了DEPT框架,旨在解决多语种和领域数据异质性对语言模型预训练的负面影响。通过解耦嵌入层与变换器主体,DEPT显著提高了模型的泛化能力,并减少了嵌入参数数量,实现了无词汇依赖的联邦多语言预训练。

DEPT: Decoupled Embeddings for Pre-training Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

本文探讨了低资源语言的多语言自动语音识别(ASR)技术,提出通过单个transformer模型和数据增强方法来提高识别精度。研究表明,多语言训练显著提升了低资源语言的识别性能,尤其在51种语言的基准测试中表现突出。通过跨语言学习和适应性激活网络等技术,展示了在低资源环境下的有效性和潜力。

多语种语音识别中的低资源语言加权交叉熵

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

该论文探讨了多语种自动语音识别和情感识别的最新进展,提出了一种基于半监督学习的情感识别方法,并比较了跨语言与单语言模型的表现。研究强调了数据增强和特征选择的重要性,结果表明跨语言训练能有效提升资源稀缺语言的情感识别能力,为未来研究提供了理论基础和评估标准。

跨语言语音情感识别:人类与自监督模型的对比

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

本文探讨了序列到序列神经翻译模型在多语种新闻监测中的故事分割和聚类问题。通过滑动窗口机制和字符级操作,提出了一种有效的多任务学习方法。研究表明,低维向量在故事聚类和分割中具有潜力,并介绍了多语言上下文嵌入的在线系统,取得了最新成果。

利用多语言语义嵌入推进广播语音的话题切分

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码