本研究提出了一种新颖的2层次SimCSE微调模型,结合无监督与监督方法,针对情感分析和语义文本相似性任务进行实验,模型在语义文本相似性任务中表现优异,平均得分达到0.742。
本文介绍了一种新型的二维母婴句子嵌入模型,具有灵活的嵌入尺寸和层数设置,在语义文本相似性任务中表现优越。该模型能够在多语言和多模态数据中有效提升嵌入质量,并在生物医学文献中表现出色。通过对不同阿拉伯语方言的分析,揭示了词汇和句法依赖的学习特点。
本文介绍了多种对比学习框架,如SimCSE、InfoCSE和DebCSE,显著提升了句子嵌入性能,适用于语义文本相似性任务。研究表明,无监督学习和新颖的样本选择方法能有效提高模型质量,推动句子表示学习的发展。
本文提出了一种基于难度的模型评估方法,通过语义文本相似性评分和深度度量学习框架,提高了模型性能评估的准确性。研究表明,该方法在多个数据集上表现优异,解决了钢材组织分类的主观性问题,达到了96%的准确率。同时,探讨了数据集粒度对学习难度的影响,提出了新的样本难度测量方法,推动了神经排序模型的研究。
该文介绍了一种名为自监督跨视图训练(SCT)的框架,用于缩小大型和小型预训练语言模型(PLM)之间的性能差距。SCT在7个语义文本相似性(STS)基准测试中,与5个基准和最先进的竞争对手相比,在21个案例中的18个中胜过竞争对手,对于参数少于100M的PLMs表现出色。
完成下面两步后,将自动完成登录并继续当前操作。