本研究提出Align-Pro方法,解决大规模语言模型(LLM)与人类价值观对齐的问题。通过将提示优化形式化为优化问题,证明了其有效性,并通过实验验证了在不调整模型参数的情况下,提示优化能够有效对齐LLM。
完成下面两步后,将自动完成登录并继续当前操作。