日本 SimCSE 技术报告

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种名为InfoCSE的无监督句子嵌入学习框架,通过引入掩蔽语言模型任务和设计网络来聚合句子信息,表现超越了SimCSE,成为无监督句子表示学习方法中的最新成果。

🎯

关键要点

  • 提出了一种名为InfoCSE的无监督句子嵌入学习框架。
  • InfoCSE引入了掩蔽语言模型任务和设计网络来聚合句子信息。
  • InfoCSE在语义文本相似性(STS)任务上超越了SimCSE。
  • 在BERT-base模型上,平均Spearman相关性增加了2.60%。
  • 在BERT-large模型上,平均Spearman相关性增加了1.77%。
  • InfoCSE成为无监督句子表示学习方法中的最新成果。
➡️

继续阅读