Apple Machine Learning Research ·

通过传输激活控制语言和扩散模型

💡 原文英文，约1800词，阅读约需7分钟。

📝

内容提要

苹果研究人员提出了一种新技术——激活传输（AcT），该技术利用最优传输理论，在不增加计算负担的情况下，实现对大型生成模型输出的精细控制。此方法适用于语言和图像生成，能有效减少有害输出并提高真实性，克服了传统方法的局限性。

🎯

🔎

激活传输（AcT）技术通过最优传输理论，实现了对生成模型输出的精细控制，避免了传统方法的高计算成本。与强化学习和指令微调相比，AcT在不影响模型整体性能的情况下，提供了更可靠的输出控制，适用于多种生成任务。

随着生成模型能力的提升，用户对输出的精细控制需求也在增加。AcT技术能够有效减少有害输出并提升生成内容的真实性，尤其在内容生成和创意写作等领域，确保生成结果符合用户期望，降低潜在风险。

线性激活传输（Linear-AcT）作为AcT的简化版本，能够快速推理并适用于大型语言模型和文本到图像生成模型。它在毒性减轻和真实感提升任务中表现出色，显示出其在实际应用中的广泛潜力。

❓

激活传输（AcT）是一种新技术，利用最优传输理论对大型生成模型的输出进行精细控制，且几乎不增加计算负担。

AcT通过学习源激活和目标激活的分布之间的最优传输映射，有效减少有害输出并提高生成内容的真实性。

传统方法如强化学习和指令微调资源消耗大，随着模型复杂性增加变得不切实际，且可能影响模型在其他任务上的表现。

Linear-AcT是AcT的简化版本，适用于大型语言模型和文本到图像生成模型，能够快速推理并提供可解释的控制参数。

AcT通过学习源和目标激活分布之间的传输映射，允许用户逐步调整生成图像的细节和风格，确保生成内容符合预期。

在毒性减轻任务中，Linear-AcT表现出色，分别在Gemma-2-2b和Llama-3-8b模型上实现了7.5倍和4.3倍的毒性降低。

🏷️