Neeko: 提高效率的多角色扮演智能体的动态 LoRA 利用

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

我们提出了一种新的架构,利用多个经过训练的LLMs的集体知识,创建了一个最先进的模型。通过自我对弈的循环,生成编排器的训练数据。在基准测试中,我们的编排器实现了与Mixtral模型相媲美的性能,但只有三分之二的成本。将GPT4集成到底层模型池中进一步提高了性能。这些发现表明我们的架构在优化多个LLMs之间的协同作用方面具有潜力。

🎯

关键要点

  • 提出了一种新的架构,利用多个经过训练的LLMs的集体知识创建最先进模型。

  • 核心是基于LLM的编排器,能够选择最佳底层LLM专家进行任务执行。

  • 通过自我对弈的灵感,创建查询生成、编排和评估的循环,以生成编排器的训练数据。

  • 在MMLU基准测试中,Leeroo编排器实现了与Mixtral模型相媲美的性能,但成本仅为三分之二。

  • 提高允许的成本可以使准确率超过Mixtral 5%以上,达到75.9%。

  • 将GPT4集成到底层模型池中进一步提高了性能。

  • Leeroo编排器以一半的成本几乎与GPT4的性能相当,甚至在降低25%成本的情况下超过了GPT4的结果。

  • 这些发现表明架构在优化多个LLMs之间的协同作用方面具有潜力。

➡️

继续阅读