小红花·文摘

本研究提出Align-Pro方法，解决大规模语言模型（LLM）与人类价值观对齐的问题。通过将提示优化形式化为优化问题，证明了其有效性，并通过实验验证了在不调整模型参数的情况下，提示优化能够有效对齐LLM。