通过增强一致性建模改进长文档主题分割模型

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

CATS是一种新的监督式文本分段模型,基于连贯性建模和多任务学习,采用两个层次相连的Transformer网络的神经架构。该模型在基准数据集上实现了最先进的分割性能,并且在零-shot语言转移方面也表现出有效性。

🎯

关键要点

  • 提出了一种新的监督式文本分段模型,称为CATS。
  • CATS模型基于连贯性建模,采用两个层次相连的Transformer网络架构。
  • 该模型是一种多任务学习模型,将句子级分段目标与连贯性目标耦合。
  • CATS在一系列基准数据集上实现了最先进的分割性能。
  • 模型在零-shot语言转移方面表现出有效性,可以分割未见过的语言中的文本。
➡️

继续阅读