本研究探讨了大规模语言模型在幽默理解方面的不足,通过将幽默理解分解为三个部分并进行改进,达到了82.4%的字幕排名准确率,超越了67%的基准,接近人类专家水平。这表明与特定群体对齐能有效提升模型的创意判断能力。
完成下面两步后,将自动完成登录并继续当前操作。