晓飞的算法工程笔记 ·

AlignSum：数据金字塔与层级微调，提升文本摘要模型性能 | EMNLP'24 - 晓飞的算法工程笔记

💡 原文中文，约2500字，阅读约需6分钟。

📝

内容提要

论文提出了AlignSum框架，通过构建数据金字塔，结合抽取、生成和人工标注的方法，提升预训练语言模型在文本摘要生成中的能力。该框架解决了低质量数据导致的自动与人工评估不一致问题，并采用高斯重采样和两阶段微调策略，使模型更好地对齐人类摘要偏好。实验结果表明，AlignSum显著提升了模型性能。

🎯

🔎

AlignSum框架通过构建数据金字塔，结合抽取、生成和人工标注的方法，充分利用有限的高质量数据，解决了低质量数据导致的评估不一致问题。这种创新性方法不仅提升了模型的性能，还为文本摘要生成领域提供了新的思路，尤其是在数据稀缺的情况下。

高斯重采样技术在AlignSum中起到了关键作用，它通过调整生成摘要的长度，使其更接近人类标注的摘要长度。这一过程有助于提高生成摘要的质量，避免了因摘要长度不一致而导致的评估偏差，确保了模型输出的摘要更符合人类的阅读习惯。

AlignSum采用的两阶段微调策略有效地解决了低熵数据对模型训练的干扰问题。通过先进行通用微调，再进行个性化微调，模型能够在保留通用能力的同时，更好地对齐人类的摘要偏好。这种策略为其他领域的模型训练提供了借鉴，尤其是在数据有限的情况下。

❓

AlignSum框架旨在提升预训练语言模型在文本摘要生成中的能力，解决低质量数据导致的自动与人工评估不一致问题。

AlignSum框架通过结合抽取式、生成式和人类标注的数据，构建了一个包含三个层级的数据金字塔。

高斯重采样用于调整生成摘要的长度，使其接近人类标注的摘要长度，从而提高摘要质量。

AlignSum采用两阶段的微调策略，包括通用微调和个性化微调，以增强模型与人类偏好的对齐。

实验结果表明，AlignSum显著提升了模型性能，超越了175B的GPT-3，在自动和人工评估中均表现优异。

AlignSum框架解决了低质量数据导致的自动与人工评估不一致的问题，并充分利用有限的高质量数据。

🏷️