Neeko: 提高效率的多角色扮演智能体的动态 LoRA 利用
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
我们提出了一种新的架构,利用多个经过训练的LLMs的集体知识,创建了一个最先进的模型。通过自我对弈的循环,生成编排器的训练数据。在基准测试中,我们的编排器实现了与Mixtral模型相媲美的性能,但只有三分之二的成本。将GPT4集成到底层模型池中进一步提高了性能。这些发现表明我们的架构在优化多个LLMs之间的协同作用方面具有潜力。
🎯
关键要点
-
提出了一种新的架构,利用多个经过训练的LLMs的集体知识创建最先进模型。
-
核心是基于LLM的编排器,能够选择最佳底层LLM专家进行任务执行。
-
通过自我对弈的灵感,创建查询生成、编排和评估的循环,以生成编排器的训练数据。
-
在MMLU基准测试中,Leeroo编排器实现了与Mixtral模型相媲美的性能,但成本仅为三分之二。
-
提高允许的成本可以使准确率超过Mixtral 5%以上,达到75.9%。
-
将GPT4集成到底层模型池中进一步提高了性能。
-
Leeroo编排器以一半的成本几乎与GPT4的性能相当,甚至在降低25%成本的情况下超过了GPT4的结果。
-
这些发现表明架构在优化多个LLMs之间的协同作用方面具有潜力。
➡️