BriefGPT - AI 论文速递 ·

Neeko: 提高效率的多角色扮演智能体的动态 LoRA 利用

💡 原文中文，约500字，阅读约需2分钟。

📝

内容提要

我们提出了一种新的架构，利用多个经过训练的LLMs的集体知识，创建了一个最先进的模型。通过自我对弈的循环，生成编排器的训练数据。在基准测试中，我们的编排器实现了与Mixtral模型相媲美的性能，但只有三分之二的成本。将GPT4集成到底层模型池中进一步提高了性能。这些发现表明我们的架构在优化多个LLMs之间的协同作用方面具有潜力。

🎯

关键要点

提出了一种新的架构，利用多个经过训练的LLMs的集体知识创建最先进模型。
核心是基于LLM的编排器，能够选择最佳底层LLM专家进行任务执行。
通过自我对弈的灵感，创建查询生成、编排和评估的循环，以生成编排器的训练数据。
在MMLU基准测试中，Leeroo编排器实现了与Mixtral模型相媲美的性能，但成本仅为三分之二。
提高允许的成本可以使准确率超过Mixtral 5%以上，达到75.9%。
将GPT4集成到底层模型池中进一步提高了性能。
Leeroo编排器以一半的成本几乎与GPT4的性能相当，甚至在降低25%成本的情况下超过了GPT4的结果。
这些发现表明架构在优化多个LLMs之间的协同作用方面具有潜力。

🏷️

Neeko: 提高效率的多角色扮演智能体的动态 LoRA 利用

内容提要

关键要点

标签

继续阅读