小红花·文摘

绝对初学者的5个有趣API

KDnuggets ·

谷歌DeepMind推出ATLAS多语言模型的扩展规律

InfoQ ·

在多语言模型中通过最小对ABX任务区分形式与意义

Apple Machine Learning Research ·

本研究探讨了多语言大型语言模型（mLLMs）评估的不足，借鉴机器翻译领域的最佳实践，提出可操作的建议，以提升mLLMs的质量评估和方法可靠性。这些标准化方法有助于理解不同模型的质量差异，对mLLMs的研究与发展具有重要意义。

Déjà Vu: Evaluating Multilingual Large Language Models through Machine Translation Assessment

BriefGPT - AI 论文速递 ·

本研究提出了一种名为RoSPrompt的方法，旨在提升小型多语言预训练模型在低资源语言中的零样本分类性能。该方法有效解决了数据依赖性问题，增强了模型在数据分布变化时的泛化能力。实验结果表明，该方法在106种语言的数据集中表现优异。

通过软提示调整增强小型语言模型的跨语言广义零样本分类

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，通过隐式奖励从英文模型获取偏好，并将其迭代训练转移到其他语言，从而有效提升多语言模型性能，减少对多语言偏好数据的需求。

An Efficient Implicit Cross-Language Reward Mechanism for Multilingual Preference Alignment

BriefGPT - AI 论文速递 ·

本研究探讨了多语言模型在知识转移和事实回忆方面的局限性，发现其在不同语言间的知识转移效果不佳。研究提出了一个包含10,000个国家相关事实的基准，并引入新指标量化跨语言的事实回忆能力，强调模型需关注语言特定的事实可靠性。

The Factuality of Language Models Depends on the Language of Inquiry

BriefGPT - AI 论文速递 ·

本研究开发了针对东南亚语言的多语言模型水手2，填补了资源缺口。该模型在500B标记上预训练，支持13种东南亚语言，并在中文和英语上表现流利。在与GPT-4o的对抗中，水手2模型的胜率达到50%，预计将推动该地区语言的发展。

Sailor 2: Navigating Southeast Asia with an Inclusive Multilingual Large Language Model

BriefGPT - AI 论文速递 ·

本研究探讨了多语言模型重标定对表现不佳语言的影响，提出AlignFreeze方法，通过冻结模型层的上半部分或下半部分，避免性能下降。研究表明，冻结下层能有效改善某些语言的词性标注效果。

AlignFreeze: Navigating the Impact of Layer Realignment in Multilingual Models

BriefGPT - AI 论文速递 ·

本研究探讨了多语言大模型在写作辅助中的表现差异，发现西班牙语使用经验降低了用户对英语模型的依赖。同时，广告来源信念影响捐赠行为，尤其是西班牙语女性对AI广告反应较为负面。这为多语言模型的设计提供了重要启示。

注意差异！在不同语言中使用多语言大模型进行劝说性协作写作任务的选择独立性

BriefGPT - AI 论文速递 ·

Hugging Face是一个强大的自然语言处理平台，提供多语言模型，简化多语言应用的开发。用户可以通过预训练模型如mBERT和XLM-R轻松进行翻译和情感分析。该平台支持快速集成和部署，帮助企业分析客户反馈、进行跨语言问答和内容摘要，推动多语言应用的创新与发展。

使用Hugging Face Transformers构建多语言应用：初学者指南

KDnuggets ·

本研究分析多语言模型在低资源语言中的知识转移表现，探讨多语言词嵌入的一致性及模型结构，揭示其优势与局限，以促进自然语言处理技术的包容性发展。

多语言语言模型如何处理多种语言？

BriefGPT - AI 论文速递 ·

LlamaIndex 新闻简报 2025-01-21

Blog on LlamaIndex ·

CohereAI开发的Aya Expanse是一种支持23种语言的多语言模型，性能优于许多现有模型。该模型提供8B和32B参数版本，适用于多语言应用。文章介绍了Aya Expanse在文本生成和翻译中的应用，展示了其强大的多语言理解能力。

探索Aya Expanse的多语言大语言模型

KDnuggets ·

本研究探讨了多语言模型在爱沙尼亚语中的适应性。调整词汇后，重训练词汇器降低了命名实体识别性能，但删除未使用标记未产生负面影响，反而提升了模型效率。

Trimming or Retraining: Optimizing Vocabulary for Multilingual Models in Estonian

BriefGPT - AI 论文速递 ·

2024年五篇最具影响力的机器学习论文

MachineLearningMastery.com ·

本研究探讨了XLM-R预训练模型在英语到日语和印尼语的跨语言迁移学习中的适用性。结果表明，该模型在日语数据集上表现最佳，并在其他数据集上也取得了良好效果，验证了多语言模型的有效性。

A Study on the Applicability of Zero-Shot Cross-Lingual Transfer Learning for Sentiment Classification in Distant Language Pairs

BriefGPT - AI 论文速递 ·

本研究探讨了多语言大型语言模型在非英语中的偏见和毒性问题。通过比较微调方法，发现使用非有害文本微调能有效降低偏见，而优化数据集更能减少毒性。研究表明，英语中的缓解效果可以迁移至其他语言，但可能影响非英语的生成能力，强调了开发语言特定缓解方法的重要性。

绝对初学者的5个有趣API

谷歌DeepMind推出ATLAS多语言模型的扩展规律

在多语言模型中通过最小对ABX任务区分形式与意义

Déjà Vu: Evaluating Multilingual Large Language Models through Machine Translation Assessment

通过软提示调整增强小型语言模型的跨语言广义零样本分类

An Efficient Implicit Cross-Language Reward Mechanism for Multilingual Preference Alignment

The Factuality of Language Models Depends on the Language of Inquiry

Sailor 2: Navigating Southeast Asia with an Inclusive Multilingual Large Language Model

AlignFreeze: Navigating the Impact of Layer Realignment in Multilingual Models

注意差异！在不同语言中使用多语言大模型进行劝说性协作写作任务的选择独立性

使用Hugging Face Transformers构建多语言应用：初学者指南

多语言语言模型如何处理多种语言？

LlamaIndex 新闻简报 2025-01-21

探索Aya Expanse的多语言大语言模型

Trimming or Retraining: Optimizing Vocabulary for Multilingual Models in Estonian

2024年五篇最具影响力的机器学习论文

A Study on the Applicability of Zero-Shot Cross-Lingual Transfer Learning for Sentiment Classification in Distant Language Pairs

Cross-Lingual Transfer of Debiasing and Detoxification in Multilingual Large Language Models: An Extensive Investigation

Meta发布Llama 3.3：一款性能和效率增强的多语言模型

有限数据下卢森堡语文本生成模型：平衡的多语言策略