Comparing Floworks with OpenAI and Anthropic: A New Framework for Enhancing LLM Function Calling
原文英文,约100词,阅读约需1分钟。发表于: 。本研究针对大型语言模型(LLMs)在工具使用和函数调用方面的局限性,提出了一种名为ThorV2的新架构,显著提升了LLMs的函数调用能力。我们通过开发针对HubSpot CRM操作的全面基准,将ThorV2与OpenAI和Anthropic的领先模型进行比较,结果显示ThorV2在准确性、可靠性、延迟和成本效率上都优于现有模型,这为更有效的AI助手和LLMs在实际应用中的发展带来了重要影响。
本研究提出ThorV2架构,增强大型语言模型(LLMs)在工具使用和函数调用方面的能力。与OpenAI和Anthropic模型相比,ThorV2在准确性、可靠性、延迟和成本效率上表现更优,推动了AI助手和LLMs的实际应用。