从大型语言模型中我们能提取多少种不同的观点?基于评判标准的多样性激励!

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

DIV-SE和IDIV-SE方法通过改变输入提示的多样性和多种演绎方法,在不改变解码过程的前提下,提高了LLM推理的准确性。在多个推理基准和最新的计划基准上,DIV-SE和IDIV-SE方法优于现有基线,特别是在4/5 Blocksworld任务上,准确率提高了至少29.6个百分点。

🎯

关键要点

  • DIV-SE和IDIV-SE方法通过改变输入提示的多样性和多种演绎方法,提高了LLM推理的准确性。
  • 这些方法在不改变解码过程的前提下,优于现有基线。
  • 在多个推理基准和最新的计划基准上表现出色。
  • 特别是在4/5 Blocksworld任务上,准确率提高了至少29.6个百分点。
  • 这些改进展示了LLM推理的准确性与成本权衡的帕累托前沿。
➡️

继续阅读