小红花·文摘

最新研究表明，推理模型可以通过“无思考”方法直接生成解决方案，表现优于传统思考方法，尤其在低资源和低延迟情况下，显示出更高效的推理性能。

MicroNN：一种可更新的设备端磁盘驻留向量数据库

Apple Machine Learning Research ·

本研究提出了一种结合非洲语言数据与高质量英文文本的训练方法，显著提升了大型语言模型在低资源非洲语言上的表现，推动了相关研究的发展。

Lugha-Llama: Adapting Large Language Models for African Languages

BriefGPT - AI 论文速递 ·

路由LLM（Routing LLM）是一种将多个大型语言模型视为“专家”的方法，通过路由器将输入分配给合适的模型，以实现高性能和低计算消耗。研究团队分析了8500多个LLM的2亿条性能记录，发现优秀的路由器能显著提升性能。RouterEval评测工具促进了低资源下的研究参与，推动了路由LLM的发展。

真·MoE？路由LLM最全面探索：一种笔记本也能玩的大模型Scaling Up研究

量子位 ·

本研究提出了FewTopNER框架，通过结合小样本命名实体识别与主题感知上下文建模，显著提升了跨语言和低资源场景中的识别准确性。

FewTopNER: Combining Few-Shot Learning with Topic Modeling and Named Entity Recognition in a Multilingual Framework

BriefGPT - AI 论文速递 ·

本研究提出了一种联合定位与激活编辑（JoLA）的方法，以解决低资源场景下微调效果受限的问题。实验结果表明，JoLA在多个基准测试中优于现有方法，具有显著的潜在影响力。

Joint Localization and Activation Editing for Low-Resource Fine-Tuning

BriefGPT - AI 论文速递 ·

在自己本地计算机上部署DeepSeek R1大模型实战

厦大数据库实验室博客 ·

本研究探讨了尼泊尔语低资源环境中持续学习的挑战，使用合成数据训练Llama 3 8B模型，结果显示样本数量增加使模型性能提升19.29%，展现了知识保持的潜力。

Domain Adaptation for Continual Learning in Low-Resource Tasks: An Evaluation in the Context of Nepali

BriefGPT - AI 论文速递 ·

能够解释其决策的人工智能模型在较少的训练数据下学习效果更佳

DEV Community ·

本研究探讨在低资源领域训练大型语言模型的挑战，并提供优化模型性能的建议，包括预训练策略和微调技术，以应对数据稀缺问题。

A Practical Guide to Fine-tuning Language Models with Limited Data

BriefGPT - AI 论文速递 ·

研究表明，变音符号在低资源情况下能显著提升机器翻译性能，而在高资源情况下则可能有害。保留或去除变音符号对翻译性能影响不大。该研究为不同数据规模下的机器翻译系统开发提供了重要见解。

不要碰我的变音符号

BriefGPT - AI 论文速递 ·

本研究提出GrammaMT方法，以解决传统机器翻译中缺乏语法指导的问题。实验结果表明，该方法在多语言和低资源环境下显著提升了翻译性能。

GrammaMT：通过语法知晓的上下文学习改进机器翻译

BriefGPT - AI 论文速递 ·

本研究提出了一种无监督方法，通过逐字挖掘和句子过滤，解决多语言和低资源任务中缺乏上下文示例的问题，在288个翻译方向上平均提升7个BLEU分数，优于传统方法。

利用大语言模型进行无监督机器翻译的有效自我挖掘上下文示例

BriefGPT - AI 论文速递 ·

本文探讨了使用GPT-4替代人工标注在低资源阅读理解任务中的效果。研究比较了模型的性能和标注成本，首次分析了大型语言模型在问答系统中作为合成数据增广器的应用，指出了其机遇和挑战，并提供了增广的低资源数据集作为评估基准。

筛选系统：以1%的成本匹配GPT-4o精度的通用数据过滤系统

BriefGPT - AI 论文速递 ·

研究重新审视了翻译记忆增强的神经机器翻译，发现其对数据拟合良好但对波动敏感。为此，提出了一种简单有效的模型，实验显示在低资源、即插即用和高资源情况下均优于传统方法。

基于深度学习方法从翻译记忆中预测固定文本的机器翻译

BriefGPT - AI 论文速递 ·

本研究提出了基于生成的提取和上下文分类（GEIC）方法，通过模型级联来提高命名实体识别准确性并降低计算资源消耗。实验结果表明，该方法在低资源和细粒度场景下达到了最先进的性能。

GEIC：基于大型语言模型的通用多语言命名实体识别

BriefGPT - AI 论文速递 ·

通过引入SeaLLMs系列，扩展Llama-2模型，解决了大型语言模型在低资源和区域语言方面的偏差问题。SeaLLM-13b模型在语言任务和助手式指令方面表现出卓越性能，并在非拉丁语言方面优于ChatGPT-3.5模型。

朝着更具包容性的人工智能：针对萨米语的大型语言模型训练的进展与展望

BriefGPT - AI 论文速递 ·

Anthropic的大型语言模型Claude 3 Opus在机器翻译中表现优于其他模型。尽管FLORES-200存在数据污染的证据，但新的基准数据证实了Claude在低资源机器翻译英语方面的有效性。Claude展示了显著的资源效率，翻译模型质量取决于资源水平。LLM翻译的进展可以压缩到传统的神经机器翻译（NMT）模型中。使用Claude的合成数据进行约鲁巴语-英语翻译的知识蒸馏达到或超过了NLLB-54B和Google翻译等强基准。

从 LLM 到 NMT：借助 Claude 推动低资源机器翻译的发展

BriefGPT - AI 论文速递 ·

本研究提出了混合稀疏适配器（MoSA）方法，通过实验证明在27个视觉任务上表现更好，适用于低资源和多任务设置。

分割与合并：通过稀疏训练释放视觉适配器的潜力

BriefGPT - AI 论文速递 ·

不要思考过程，推理模型能力能够更强丨UC伯克利等最新研究

AI推理：顶尖表现可能不需要思考

MicroNN：一种可更新的设备端磁盘驻留向量数据库

Lugha-Llama: Adapting Large Language Models for African Languages

真·MoE？路由LLM最全面探索：一种笔记本也能玩的大模型Scaling Up研究

FewTopNER: Combining Few-Shot Learning with Topic Modeling and Named Entity Recognition in a Multilingual Framework

Joint Localization and Activation Editing for Low-Resource Fine-Tuning

在自己本地计算机上部署DeepSeek R1大模型实战

Domain Adaptation for Continual Learning in Low-Resource Tasks: An Evaluation in the Context of Nepali

能够解释其决策的人工智能模型在较少的训练数据下学习效果更佳

A Practical Guide to Fine-tuning Language Models with Limited Data

不要碰我的变音符号

GrammaMT：通过语法知晓的上下文学习改进机器翻译

利用大语言模型进行无监督机器翻译的有效自我挖掘上下文示例

筛选系统：以1%的成本匹配GPT-4o精度的通用数据过滤系统

基于深度学习方法从翻译记忆中预测固定文本的机器翻译

GEIC：基于大型语言模型的通用多语言命名实体识别

朝着更具包容性的人工智能：针对萨米语的大型语言模型训练的进展与展望

从 LLM 到 NMT：借助 Claude 推动低资源机器翻译的发展

分割与合并：通过稀疏训练释放视觉适配器的潜力