DebCSE:从去偏见的角度重新思考无监督对比句嵌入学习

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种名为InfoCSE的无监督句子嵌入学习框架,通过掩蔽语言模型任务和特殊的网络设计来聚合句子信息。在语义文本相似性任务上,该框架表现超越了SimCSE,成为无监督句子表示学习方法中的最新成果。

🎯

关键要点

  • 提出了一种名为InfoCSE的无监督句子嵌入学习框架。

  • 框架引入了掩蔽语言模型任务和特殊的网络设计。

  • 通过设计,强制[CLS]位置的表示聚合更密集的句子信息。

  • 在语义文本相似性任务上,InfoCSE超越了SimCSE。

  • 平均Spearman相关性提高了2.60%(BERT-base)和1.77%(BERT-large)。

  • InfoCSE成为无监督句子表示学习方法中的最新成果。

➡️

继续阅读