小红花·文摘

本研究提出了ToolACE-DEV框架，通过将工具学习目标分解为子任务，增强模型基本能力，并引入自我演化机制，实现轻量级模型的自我改善。该方法在不同规模和架构的模型上验证了其有效性，具有重要应用潜力。

ToolACE-DEV: Self-Improving Tool Learning through Decomposition and Evolution

BriefGPT - AI 论文速递 ·

该研究提出了新方法ToolACE-R，针对工具学习的不足，引入自适应自我优化策略，通过迭代训练提升工具调用性能，实现高效优化。

ToolACE-R: A Tool Learning Method with Adaptive Self-Optimization

BriefGPT - AI 论文速递 ·

小心导师

DEV Community ·

本研究提出了ATLASS工具学习与选择系统，采用闭环框架，支持大语言模型动态生成外部工具，显著提升工具的适应性和可重复使用性，有效解决复杂任务。

Advanced Tool Learning and Selection System (ATLASS): A Closed-Loop Framework Based on Large Language Models

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）在工具学习中的能力，提出了ToolEyes系统以评估其在真实场景中的表现。研究分析了工具学习的五个关键方面，发现模型规模扩大并未改善工具学习能力，反而可能加剧问题。通过模块化框架和仿生方法，研究展示了提高LLMs工具使用效率的途径，并强调了持续学习在适应动态环境和工具变化中的重要性。

从探索到掌握：通过自驱动交互使大型语言模型掌握工具

BriefGPT - AI 论文速递 ·

本研究介绍了StepTool，一种新的分步强化学习框架，解决大型语言模型在工具学习中的问题。通过分步奖励和优化，StepTool显著提升了工具学习效果，优于现有方法，适用于复杂任务环境。

StepTool: A Stepwise Reinforcement Learning Framework for Tool Learning in Large Language Models

BriefGPT - AI 论文速递 ·

本文介绍了ToolLLM框架，提升了自然语言模型的规划与推理能力。ToolLLaMA在复杂指令执行上表现优异，ToolEyes系统评估了LLMs的工具学习能力，发现模型在工具选择上存在局限。RoTBench和RoTTuning策略增强了LLMs的鲁棒性，研究探讨了工具学习的益处与挑战，并提出标准化教学方法以提高LLMs的效率与准确性。

为大型语言模型学习演变工具

BriefGPT - AI 论文速递 ·

本文综述了大型语言模型（LLMs）在工具学习中的应用，探讨了其益处及实现方法，提出了评估工具使用能力的基准测试MetaTool。研究表明，持续学习技术能提高LLMs的适应性，强调了工具学习在复杂任务中的潜力和未来发展方向。

工具学习的稳定性受到什么影响？对工具学习框架的鲁棒性进行的实证研究

BriefGPT - AI 论文速递 ·

本研究探讨了通过工具学习增强大型语言模型能力的方法，提出了ConAgents框架和Tool-Planner框架，优化了模型在复杂环境中的表现。实验结果显示，配备工具的模型在数据库和知识库任务中的性能显著提升。此外，EASYTOOL框架简化了工具文档，提高了工具的利用效率。整体上，研究展示了大型语言模型在实际应用中的潜力和发展方向。

工具故障：检测有故障的工具中的静默错误

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）与工具学习的结合，提出了COLT模型及新方法P&R、E&G，显著提升了工具检索性能。通过文献综述，分析了工具学习的益处与实施流程，并强调了持续学习的重要性。此外，研究介绍了ReFeed管道、Confucius框架和仿生方法STE，展示了在真实场景中提高LLMs能力的有效性。

利用大型语言模型的迭代反馈增强工具检索

BriefGPT - AI 论文速递 ·

本研究提出了一种名为oolname的工具，利用大语言模型的推理能力自动选择和评估模型，从而提高实验效率。初步评估表明，该工具在准确性和效率上优于传统方法。此外，研究还探讨了在预算约束下的工具学习方法，结合动态规划和经验估计，显著提升了效果。

同构工具的自适应选择：在 RAG 场景中的实例化

BriefGPT - AI 论文速递 ·

现有对工具学习的评估主要关注验证大型语言模型（LLMs）与预期结果的一致性。为解决这个问题，提出了ToolEyes系统，用于评估LLMs在真实场景中的工具学习能力。该系统细致地检查了七个现实世界的场景，分析了五个关键方面。评估结果显示，LLMs对特定场景有偏好，并且在工具学习方面的认知能力有限。这些发现为推动工具学习领域提供了有益见解。

ToolEyes：大规模语言模型在实际场景中工具学习能力的细粒度评估

BriefGPT - AI 论文速递 ·