DebCSE:从去偏见的角度重新思考无监督对比句嵌入学习
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种名为InfoCSE的无监督句子嵌入学习框架,通过掩蔽语言模型任务和特殊的网络设计来聚合句子信息。在语义文本相似性任务上,该框架表现超越了SimCSE,成为无监督句子表示学习方法中的最新成果。
🎯
关键要点
-
提出了一种名为InfoCSE的无监督句子嵌入学习框架。
-
框架引入了掩蔽语言模型任务和特殊的网络设计。
-
通过设计,强制[CLS]位置的表示聚合更密集的句子信息。
-
在语义文本相似性任务上,InfoCSE超越了SimCSE。
-
平均Spearman相关性提高了2.60%(BERT-base)和1.77%(BERT-large)。
-
InfoCSE成为无监督句子表示学习方法中的最新成果。
➡️