小红花·文摘

本研究提出了一种新训练目标，通过对语义表示施加约束，增强正样本对齐。同时，针对BERT模型的注意力沉没现象，提出交叉注意力结构，以提升CLS标签的注意力和池化质量。该方法在多个语义文本相似度任务中表现优异。

JTCSE: Joint Tensor Modal Constraints and Cross-Attention for Unsupervised Contrastive Learning of Sentence Embeddings

BriefGPT - AI 论文速递 ·

数据归类工具

Raz1ner ·

数据归类工具

Raz1ner ·

本研究提出了一种一致性聚焦的相似性比较框架（ConSCompF），用于比较生成大语言模型（LLMs）。该框架在少量未标记数据上操作，能够有效计算模型生成文本的相似度评分，帮助识别模型输出的相似性及潜在的投资欺诈风险。

Consistency-Focused Similarity Comparison Framework for Generative Large Language Models

BriefGPT - AI 论文速递 ·

今天探讨了集合论和范畴论下的标签体系，关注文本相似度计算，尽管算法较为机械。通过语义寻找相似性，AI提供了大模型的实现方法，标签体系似乎是大模型设计的基本视角。

难道我发现了大模型的基本逻辑？

学无止境@一点一滴 ·

本研究提出了一种基于SAPPhIRE因果模型的新颖性评估框架，通过比较当前问题与历史问题的文本相似度，实现自动化评估，显著提升评估效率。

使用问题SAPPhIRE概念支持设计问题的新颖性评估

BriefGPT - AI 论文速递 ·

本研究探讨了将复杂政治要求分解为子问题的方法，以判断其真实性。提供了ClaimDecomp数据集和训练好的注释方法，旨在提高自动事实检测的准确性和效率。研究表明，通过子问题生成和基于文本相似度的查询，可以显著改善模型的推理可靠性和生成质量。

QuestGen：事实检查应用中的问题生成方法的有效性

BriefGPT - AI 论文速递 ·

这篇文章讨论了孪生网络在文本相似度任务中的应用，特别是《Learning Text Similarity with Siamese Recurrent Networks》。孪生网络通过相同结构将两个查询映射到高维空间以计算相似度。使用BiLSTM结构的实验表明，损失函数的阈值设置对结果影响显著。孪生网络提供了一种不同于BERT的相似度计算方法，值得进一步探索。

孪生网络做 query 相似度任务

informal ·