蒙特卡洛树搜索用于使用 GPT-2 生成菜谱

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种在解码过程中控制基于Transformers的大型语言模型生成长文本的方法,避免对模型进行微调。通过使用鉴别器推导限制条件,可以更细致、动态地应用限制条件。经过评估,基于鉴别器引导的Monte Carlo Tree Search解码方法在两种语言中表现出最先进的效果。

🎯

关键要点

  • 本文探讨如何在解码过程中控制基于Transformers的大型语言模型生成长文本。
  • 该方法避免了对模型进行微调,训练代价更小且更易于实现。
  • 通过使用鉴别器推导限制条件,可以更细致、动态地应用限制条件。
  • 基于鉴别器引导的Monte Carlo Tree Search解码方法在法语和英语中表现出最先进的效果。
  • 该方法在多样性鼓励下的重新排序方案中也取得了良好效果。
🏷️

标签

➡️

继续阅读