TL训练:基于任务特征的大型语言模型工具使用训练框架
📝
内容提要
本研究针对大型语言模型在工具使用中的任务特性不足的问题,提出了TL训练框架。通过动态调整token权重和制定针对错误类别的奖励机制,该框架显著提升了模型在工具使用性能和任务泛化能力方面的表现,验证了在少量训练数据下的有效性。
🏷️
标签
➡️