小红花·文摘

本报告介绍了OpenBA，一个开源的150亿双语不对称seq2seq模型，展示了其在多个基准测试中的优越性能。通过三阶段训练策略和有效技术，OpenBA在资源有限的情况下表现出色。此外，Baichuan 2系列模型在公共基准测试中表现优异，尤其在医学和法律领域。研究还提出了多语言LLM压缩方法，以改善低资源语言的性能。

OpenBA-V2：使用快速多阶段剪枝达到 77.3% 的高压缩比

BriefGPT - AI 论文速递 ·

本文介绍了一个开源的150亿双语不对称seq2seq模型OpenBA，通过三阶段训练策略从头开始训练模型，展现出卓越性能，提供了预训练的主要细节，并重构了代码以符合Huggingface Transformers Library的设计原则。

OpenBA：一个从零开始的开源 15B 双向语言模型预训练

BriefGPT - AI 论文速递 ·