稀疏对比学习的句子嵌入
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种名为InfoCSE的对比学习框架,用于学习无监督的句子嵌入。该框架在语义文本相似性任务上表现出色,成为无监督句子表示学习方法中的最新成果。框架引入了一个额外的掩蔽语言模型任务和一个经过精心设计的网络来强制[CLS]位置的表示聚合更密集的句子信息。
🎯
关键要点
-
提出了一种名为InfoCSE的对比学习框架,用于学习无监督的句子嵌入。
-
框架引入了额外的掩蔽语言模型任务。
-
设计了一个网络以强制[CLS]位置的表示聚合更密集的句子信息。
-
在语义文本相似性任务上,InfoCSE超越了SimCSE的表现。
-
平均Spearman相关性增加了2.60%(BERT-base)和1.77%(BERT-large)。
-
成为无监督句子表示学习方法中的最新成果。
➡️