Seal-Tools: 自助工具学习数据集用于代理调整和详细基准测试
💡
原文中文,约500字,阅读约需1分钟。
📝
内容提要
本研究提出了一个新的工具学习数据集Seal-Tools,包含自学习的类似API的工具,能实现数据的大规模生成和展示工具的实际应用。Seal-Tools采用自学习方法生成工具和实例,包含难度较高的实例,可作为评估LLMs的工具调用能力的新基准。评估结果显示系统还未完美。
🎯
关键要点
- 本研究提出了一个新的工具学习数据集 Seal-Tools。
- Seal-Tools 包含自学习的类似 API 的工具,能够实现数据的大规模生成。
- 该数据集展示了工具的实际应用,并确保了生成过程的精确控制。
- Seal-Tools 包含一些难度较高的实例,需要调用多个嵌套的工具来完成任务。
- 为了评估工具调用能力,采用了严格的格式控制和三个评估指标。
- Seal-Tools 可作为评估 LLMs 的工具调用能力的新基准。
- 评估结果显示当前的系统还未达到完美。
➡️