日本 SimCSE 技术报告
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种名为InfoCSE的无监督句子嵌入学习框架,通过引入掩蔽语言模型任务和设计网络来聚合句子信息,表现超越了SimCSE,成为无监督句子表示学习方法中的最新成果。
🎯
关键要点
- 提出了一种名为InfoCSE的无监督句子嵌入学习框架。
- InfoCSE引入了掩蔽语言模型任务和设计网络来聚合句子信息。
- InfoCSE在语义文本相似性(STS)任务上超越了SimCSE。
- 在BERT-base模型上,平均Spearman相关性增加了2.60%。
- 在BERT-large模型上,平均Spearman相关性增加了1.77%。
- InfoCSE成为无监督句子表示学习方法中的最新成果。
➡️