💡
原文英文,约200词,阅读约需1分钟。
📝
内容提要
大型生成模型的能力提升引发了对其可靠性和安全性的担忧。为此,本文提出了激活传输(AcT)框架,通过最优传输理论引导模型激活,控制生成输出的概念和行为。AcT适用于多种模式,能够以极小的计算开销实现对模型行为的精细控制。实验表明,AcT有效减轻毒性、引入概念、提高真实性,并实现风格控制和概念否定。
🎯
关键要点
- 大型生成模型的能力提升引发了对其可靠性和安全性的担忧。
- 本文提出了激活传输(AcT)框架,通过最优传输理论引导模型激活。
- AcT适用于多种模式,能够以极小的计算开销实现对模型行为的精细控制。
- 实验表明,AcT有效减轻毒性、引入概念、提高真实性。
- 在文本到图像的扩散模型中,AcT实现了风格控制和概念否定。
➡️