repetition_penalty是优化大型语言模型(LLM)推理中重复输出问题的参数。设置大于1.0的值可以降低已出现token的概率,从而减少重复。这一方法源于2019年CTRL论文,通过调整logits实现,实测表明调整该参数能显著影响模型输出的token概率。
完成下面两步后,将自动完成登录并继续当前操作。