BriefGPT - AI 论文速递 ·

基于标记的决策准则在上下文学习中存在亚最优问题

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

现代自回归语言模型研究了上下文学习中的校准问题。实验表明，模型大小和数据集微调对性能与校准之间的权衡有显著影响。提出的线性校准技术（LinC）在少量样本下显著提升模型预测性能，平均改善率达21%。此外，研究了标签偏移现象，并提出生成校准方法，优化了文本分类任务的表现。

🎯

❓

线性校准技术（LinC）是一种在少量样本下显著提升模型预测性能的方法，能够改善基于上下文学习的模型的概率输出校准。

增加模型大小和上下文学习示例，以及使用指导和强化学习等方法进行微调，会显著影响模型的性能与校准之间的权衡。

标签偏移现象是指在上下文学习中，标签的边际分布与预测分布之间存在不一致，可能导致模型性能下降。

通过优化上下文学习中的示例排序，可以选择更好的上下文示例，从而提高文本分类的准确性。

NoisyICL方法通过在模型参数中引入随机噪声，旨在改善In-Context Learning的性能和校准，提供更准确和可靠的预测结果。

批量校准（BC）方法能够有效控制批量输入的上下文偏差，统一多种校准方法，并在少样本设置下表现出色，成本低。

🏷️