小红花·文摘

本文研究了在低资源语言中适应大型语言模型（LLMs）的方法，提出了扩展词汇表和使用双语数据等策略，以提高模型性能。实验结果显示，这些方法在多种语言上表现优异，尤其在机器翻译任务中显著提升了翻译能力。此外，有限数据集的多语调优与单语模型的表现相当，具有重要的实用价值。

LlamaTurk：为低资源语言适应开源生成型大语言模型

BriefGPT - AI 论文速递 ·

本文提出了一种基于CLIP模型和图像水平监督的对象中心对齐方法，通过伪标注实现高质量对象提议并扩展词汇表，将两种对象对齐策略结合，实现了在OVD方案中对象和图像中心表示的最小化差距。该方法在COCO数据集上取得了36.6的AP50表现，在LVIS上，在罕见类别上超越了最新的ViLD模型达5.0的掩膜AP，总体提高3.4。

DST-Det: 开放词汇目标检测的简单动态自训练

BriefGPT - AI 论文速递 ·