小红花·文摘

本研究提出了一种代理混合解码策略，以提高大规模语言模型在多样化任务中的适应性。该方法通过动态选择最合适的模型，显著提升了性能，平均奖励提高1.56倍，胜平负比率提升71.89%。