小红花·文摘

本文提出了一种名为OPRO的优化方法，利用大型语言模型（LLM）进行优化任务。研究表明，OPRO在多个任务上优于人工设计的提示，提升了任务准确性。同时介绍了LLaMoCo框架，通过指令调整和对比学习提高LLM的优化性能。研究比较了不同LLM在自然语言处理中的表现，发现GPT-4在处理问题描述时表现最佳，并探讨了多模式方法在优化中的优势及LLM的局限性。

LLMOPT：从零开始学习定义和解决一般优化问题

BriefGPT - AI 论文速递 ·

本文提出了一种名为OPRO的优化方法，利用大型语言模型优化任务，实验结果显示其在多项任务中优于传统提示设计。通过结合人类反馈和遗传算法，OPRO在多步任务中实现了显著改进。此外，研究还探讨了多模态小型语言模型的设计，提出了Mipha助手，并展示了其在多个基准测试中的优越性能。

多阶段语言模型程序的指示和演示优化

BriefGPT - AI 论文速递 ·

本文提出了一种名为OPRO的优化方法，利用大型语言模型（LLM）进行自动提示优化，研究表明其在多个任务中优于人工设计的提示，提升了任务准确性。同时，提出了“自动行为优化”新范式，以优化目标模型行为，并探讨了LLM在交互式任务中的应用，展示了其在效率和性能上的优势。

重新审视 OPRO：小规模语言模型作为优化器的局限性

BriefGPT - AI 论文速递 ·

本文介绍了一种名为OPRO的优化方法，利用大型语言模型作为优化器，通过自然语言描述优化任务。作者展示了OPRO在线性回归和旅行商问题上的应用，并通过实验证明OPRO通过优化提示的方式胜过人工设计的提示，在GSM8K上提高了最多8％，在Big-Bench Hard任务上提高了最多50％。

大型语言模型作为优化器

BriefGPT - AI 论文速递 ·