小红花·文摘

本文介绍了一种交互式系统误差分析与标记工具（SEAL），通过两步法识别高误差数据，结合语言模型和图像模型解决NLP中的标签缺失问题。研究提出了StableToolBench基准测试，评估大型语言模型使用工具的能力，并展示了ToolLLM框架在增强模型推理能力方面的效果。通过ToolQA数据集和EASYTOOL框架，显著提高了工具使用的准确性和效率。