对 SwissBERT 编码模型进行微调,用于嵌入句子和文档
原文中文,约200字,阅读约需1分钟。发表于: 。对句子或短文档进行嵌入式编码的编码器模型,用于语义搜索和主题建模。本文介绍了一种专门为此目的微调的 SwissBERT 编码器模型版本,采用对瑞士四种国家语言(德语、法语、意大利语和罗曼什语)进行了预训练,使用对应文章子集的对比学习进行微调,实验证明 SentenceSwissBERT 在瑞士特定环境下的文档检索和文本分类任务中表现对原始 SwissBERT 模型和可比基准模型的准确性。该模型可供研究使用。
SwissBERT是一个处理与瑞士有关的文本的掩模语言模型,适用于瑞士的多种语言。该模型使用语言适配器,在处理新闻和罗曼什・格里施人时表现更好。模型和开源代码已发布。