麻省理工学院和IBM的研究团队提出了一种新方法SASA,使大型语言模型能够自我调节输出,减少有害语言,同时保持流畅性。该方法通过评估生成词汇的毒性,逐步引导生成更合适的语言,旨在实现更公平和符合人类价值观的语言生成。
完成下面两步后,将自动完成登录并继续当前操作。