小红花·文摘

本报告介绍了OpenBA，一个开源的150亿双语不对称seq2seq模型，通过三阶段训练策略从头开始训练模型。该模型在多个基准测试上表现出色，并提供了预训练的主要细节和增强技术。代码已重构以符合Huggingface Transformers Library的设计原则，并发布了不同训练阶段的检查点。

OpenBA-V2：使用快速多阶段剪枝达到 77.3% 的高压缩比

BriefGPT - AI 论文速递 ·

Bailong：基于 QLoRA 和 Zip-tie 嵌入的双语迁移学习

BriefGPT - AI 论文速递 ·

本报告介绍了OpenBA，一个开源的150亿双语不对称seq2seq模型，通过三阶段训练策略从头开始训练模型。该模型在多个基准测试上表现出色，提供了预训练的主要细节和增强技术。代码已重构以符合Huggingface Transformers Library的设计原则，并发布了不同训练阶段的检查点。

Breeze-7B 技术报告

BriefGPT - AI 论文速递 ·