通过统计合约激励高质量文本生成
原文中文,约500字,阅读约需2分钟。发表于: 。当前的大型语言模型(LLMs)成功增加了对机器生成文本的需求,然而目前的按令牌计费模式存在一种经济学上称为道德风险的激励错位:生成文本的代理有强烈的动机通过偏好更便宜的模型来降低成本,并且这可以在内部执行推理的过程中完成。我们从经济学角度提出了一种以绩效为基础的以合同为基础的框架来解决这个问题。通过研究代理生成文本的贵重推理过程,并以自动质量评估来决定合同确定主体根据文本支付的金额,我们研究...
研究者提出了一种以绩效为基础的以合同为基础的框架来解决大型语言模型存在的经济学上的激励错位问题。通过研究代理生成文本的贵重推理过程,并以自动质量评估来决定合同确定主体根据文本支付的金额,他们发现成本 - 稳健合同只需要微不足道的目标价值增加。