小红花·文摘

ToolEyes是一个用于评估大型语言模型在真实场景中工具学习能力的系统。通过细致检查七个现实场景，分析了LLMs在工具学习中的五个关键方面。评估结果显示，LLMs对特定场景有偏好，工具学习认知能力有限。模型尺寸的扩大加剧了对工具学习的阻碍。这些发现对推动工具学习领域具有重要意义。