小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
分析语言相似性对跨语言迁移的影响:任务和输入表示的重要性

跨语言迁移是一种提升低资源环境下NLP任务训练数据的方法。本文分析了263种语言在词性标注、依存解析和主题分类等任务中的迁移情况,发现语言相似性对迁移性能的影响受任务、输入表示和相似性定义等因素的制约。

分析语言相似性对跨语言迁移的影响:任务和输入表示的重要性

Apple Machine Learning Research
Apple Machine Learning Research · 2025-06-04T00:00:00Z

本研究提出FuxiMT,一种针对低资源环境的多语种机器翻译模型。该模型通过在大型中文语料库上预训练,并在65种语言的平行数据集上微调,展现出优越的翻译能力,尤其在缺乏平行数据时的零-shot翻译表现突出,具有实用潜力。

FuxiMT: A Sparse Large Language Model for Chinese-Centric Multilingual Machine Translation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

该研究采用大规模弱监督学习方法,解决阿拉伯语语音识别中的标注数据不足问题。训练的ASR模型在缺乏人工标签的情况下,仍在标准测试中表现优异,验证了弱监督学习在低资源环境中的有效性。

Advancing Arabic Speech Recognition Through Large-Scale Weakly Supervised Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-16T00:00:00Z

本研究提出MT-R1-Zero模型,利用R1-Zero强化学习框架提升机器翻译质量。该模型通过混合奖惩机制,展现出强大的泛化能力和竞争力,特别适用于低资源和多语言环境。

MT-R1-Zero: Advancing LLM-based Machine Translation via R1-Zero-like Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z

本研究提出了CoRAG框架,以解决知识密集型任务中的少样本学习问题。实验结果表明,CoRAG在低资源环境下优于传统方法,并揭示了共享通道中段落对模型性能的影响。

CoRAG:协作检索增强生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z

本研究评估了生成性人工智能模型在尼泊尔语命名实体识别中的表现,探讨了低资源环境下的挑战与机遇,为自然语言处理领域提供了重要贡献。

Named Entity Recognition in Low-Resource Languages Using Generative Artificial Intelligence: A Case Study of Nepali

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-12T00:00:00Z

本研究介绍了首个德国语方言检索数据集WikiDIR,指出传统词汇方法在高变异情况下的不足,强调在低资源环境下开发方言特定检索模型的重要性,并证明文档翻译能有效缩小方言差距。

Cross-Dialect Information Retrieval: Information Access in Low-Resource and High-Variance Languages

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-17T00:00:00Z

本研究提出了一种上下文过滤方法,通过奖励建模去除问答任务中的非必要信息,显著提升低资源环境下问答模型的有效性,EM Per Token指标提高了6.8倍。

Context Filtering in Question Answering Based on Reward Modeling

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z
MicroK8s与ngrok:边缘设备的简易入口

MicroK8s是Canonical推出的轻量级Kubernetes版本,适合边缘设备。ngrok提供安全入口,简化访问。两者结合优化边缘计算,降低延迟,增强安全性。MicroK8s适合低资源环境,ngrok确保网络安全。

MicroK8s与ngrok:边缘设备的简易入口

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2024-10-16T15:00:00Z

SHAKTI是一种针对边缘AI和低资源环境优化的语言模型,拥有25亿参数,专为智能手机、可穿戴设备和物联网设计,能够在医疗、金融和客户服务等领域提供高效性能和精确度。

SHAKTI: A 2.5 Billion Parameter Small Language Model Optimized for Edge AI and Low-Resource Environments

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-15T00:00:00Z

麻省理工学院开发了ScribblePrompt,一种用于生物医学图像分割的交互工具。它利用神经网络,支持涂鸦、点击和边界框等多种注释方式,适合不同标签和图像类型。研究显示,ScribblePrompt在速度和准确性上优于现有方法,并能在低资源环境中高效运行。

入选ECCV 2024!覆盖5.4w+图像,MIT提出医学图像分割通用模型ScribblePrompt,性能优于SAM

HyperAI超神经
HyperAI超神经 · 2024-09-27T05:56:51Z

研究表明,在低资源环境下,通过字符级到单词级的转化可以显著提升语音翻译的速度和准确性。使用预训练的声学模型和数据增强技术,有效提高了自动语音翻译的质量。新提出的基于课程学习和互连机制的方法进一步优化了语音特征提取和翻译性能,实验结果显示BLEU分数显著提升。

揭示预训练在直接语音翻译中的作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z

本研究探讨了自监督学习在低资源环境下的自动语音识别(ASR)中的应用,分析声学和语言信息以降低单词错误率。研究评估了不同语言模型在非洲裔美国人语言和突尼斯阿拉伯口音中的表现,发现自监督学习模型在多种语言的ASR任务中表现优异。

自监督语音表示仍然难以应对非裔美国人方言英语

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-26T00:00:00Z

本文介绍了多种基于序列到序列模型的关系抽取方法,如seq2rel、RSMAN和PRiSM,展示了它们在生物医学数据集上的优越性能。这些方法通过引入注意力机制、迭代推理和关系嵌入等技术,克服了传统方法的局限性,尤其在低资源环境和长尾问题上表现突出。

基于关系分类器的文档级关系提取大语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-25T00:00:00Z

本文研究了低资源环境下的自动语音识别(ASR)技术,提出了Whistle方法,通过国际音标转写和自监督学习提高多语言识别性能。实验结果表明,该方法显著降低了训练数据需求,并提升了识别精度。

通过弱监督音素为基础的多语言预训练,实现对瑶族苗语的低资源语音识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-18T00:00:00Z

本文探讨了神经机器翻译中的知识蒸馏技术,研究表明该技术能在保持翻译质量的同时显著减少学生模型的参数数量并提高运行速度。通过层级监督和动态样本选择等方法,提升了模型在低资源环境下的效率和效果,实验结果验证了其在多语言翻译任务中的有效性。

不要丢弃数据:更好的序列知识蒸馏

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-15T00:00:00Z

本文研究了在低资源环境中简单启发式词向量初始化方法的有效性,发现其在目标词汇规模和适应数据变化时优于复杂方法。同时,探讨了多语言模型中的词汇缺失问题及其解决方案,提出了FOCUS方法以提高嵌入初始化效果,强调跨语言词汇适应对模型性能的提升。

语言模型的词汇扩展和初始化方法的实证比较

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-08T00:00:00Z

本文提出了一种新型对话系统模型,通过解耦响应解码器和知识增强方法,在低资源环境下实现高效学习。实验结果显示,该模型在多个基准测试中表现优异,能够生成准确且有据可依的回应,提升了对话系统的鲁棒性和事实一致性。

一种融合真实性和多样性的基于知识的对话生成解码方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-08T00:00:00Z

本文介绍了多种针对中文及其他语言的命名实体识别(NER)方法,包括Mulco模型、Biaffine对比学习框架和混合标注方法。这些方法在不同数据集上经过实验验证,尤其在处理嵌套实体和低资源环境下的NER任务中表现优异,显示了大型语言模型提升数据集质量的潜力。

使用数据增强的嵌套命名实体识别的复合嵌套学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-18T00:00:00Z

本研究提出了一种数据增强方法,旨在提升神经机器翻译系统在低频词汇和低资源环境中的翻译质量。实验结果表明,该方法在多个任务中显著提高了翻译性能,尤其在材料科学和生物医学领域。通过结合不同数据集和生成新样本,增强了训练数据的多样性和相关性。

针对低资源事件抽取的目标增强

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码