该研究提出了一种多任务定制通用大型语言模型的方法,通过在多语言混合单语和平行数据上进行持续预训练,创建了TowerBase,并在与翻译过程相关的指令上进行微调,创建了TowerInstruct。最终模型在与翻译工作流相关的多个任务上超过了开放式替代方案,并与通用封闭式语言模型相媲美。研究者还发布了Tower模型、专业数据集、LLM评估框架以及一系列模型生成版本的基准。
完成下面两步后,将自动完成登录并继续当前操作。