通过增强一致性建模改进长文档主题分割模型
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
CATS是一种新的监督式文本分段模型,基于连贯性建模和多任务学习,采用两个层次相连的Transformer网络的神经架构。该模型在基准数据集上实现了最先进的分割性能,并且在零-shot语言转移方面也表现出有效性。
🎯
关键要点
- 提出了一种新的监督式文本分段模型,称为CATS。
- CATS模型基于连贯性建模,采用两个层次相连的Transformer网络架构。
- 该模型是一种多任务学习模型,将句子级分段目标与连贯性目标耦合。
- CATS在一系列基准数据集上实现了最先进的分割性能。
- 模型在零-shot语言转移方面表现出有效性,可以分割未见过的语言中的文本。
➡️