从总结到行动:利用开放式接口增强大规模语言模型对复杂任务的应用
原文中文,约400字,阅读约需1分钟。发表于: 。人类与动物之间的区别在于人类可以使用和创造工具,而使大型语言模型具备学习外部工具使用的能力可以成为实现人工智能的重要一步。本研究引入了一种新的工具调用管道,设计用于控制庞大的真实世界应用程序接口,通过 ` 从摘要到行动 ' 的 Sum2Act 管道,在复杂的真实用户查询中模拟人类解决问题的过程,从而提高了大型语言模型的性能,优于现有的方法。
通过引入ToolLLM,一个通用工具使用框架,展示了它在增强自然语言模型的规划和推理能力方面的影响。通过使用ChatGPT创建指导数据集ToolBench,并使用深度优先搜索决策树扩展搜索空间,有效地获取解决方案路径。通过微调LLaMA得到ToolLLaMA,评估器ToolEval显示ToolLLaMA在执行复杂指令和推广到未见过的API方面表现出卓越能力。设计了神经API检索器为每个指令推荐适当的API,省去了手动选择API的步骤。