苹果研究人员提出了一种新技术——激活传输(AcT),该技术利用最优传输理论,在不增加计算负担的情况下,实现对大型生成模型输出的精细控制。此方法适用于语言和图像生成,能有效减少有害输出并提高真实性,克服了传统方法的局限性。
大型生成模型的能力提升引发了对其可靠性和安全性的担忧。为此,本文提出了激活传输(AcT)框架,通过最优传输理论引导模型激活,控制生成输出的概念和行为。AcT适用于多种模式,能够以极小的计算开销实现对模型行为的精细控制。实验表明,AcT有效减轻毒性、引入概念、提高真实性,并实现风格控制和概念否定。
完成下面两步后,将自动完成登录并继续当前操作。