BriefGPT - AI 论文速递 ·

FuseGen: 基于数据生成的零样本学习的 PLM 融合

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文介绍了多种基于预训练语言模型的零样本学习方法，如SunGen、ZeroGen和ProGen，旨在自动生成高质量数据以提升模型性能。这些方法在文本分类、问答和自然语言推理等任务中表现优异，有效提高了小型模型的泛化能力和推理效率。

🎯

❓

SunGen 是一种噪声鲁棒的框架，用于自动构建零样本分类问题中的高质量数据，旨在提升模型性能和效率。

ZeroGen 是一种灵活高效的零样本学习方法，通过基于预训练语言模型生成无监督数据集，适用于文本分类、问答和自然语言推理等任务，从而提高推理效率。

ProGen 是一种渐进式的零样本数据集生成框架，利用任务特定模型的反馈生成新的训练数据，实验表明其在文本分类上有效。

使用加权最大似然度量训练生成器可以鼓励生成器生成分类标签的样本，从而在小样本和合成样本上取得更好的结果。

使用预训练语言模型进行全零样本学习的自然语言理解任务，在多个分类任务上取得了强劲表现，显示出良好的泛化能力。

Genixer 通过创新的数据生成方法，为不同任务生成高质量的多模态指令调整数据，从而改进现有大型语言模型的性能。

🏷️