Ruler: 一种模型无关的方法以控制大型语言模型生成长度
发表于: 。本研究解决了大型语言模型在生成特定长度响应时的困难,提出了一种新的目标长度生成任务(TLG)及两个评估指标。研究中引入的Ruler方法,通过使用元长度令牌(MLTs),能够有效提升模型在长度受限指令下的指令遵循能力,展现出良好的通用性和适应性。
本研究解决了大型语言模型在生成特定长度响应时的困难,提出了一种新的目标长度生成任务(TLG)及两个评估指标。研究中引入的Ruler方法,通过使用元长度令牌(MLTs),能够有效提升模型在长度受限指令下的指令遵循能力,展现出良好的通用性和适应性。