小红花·文摘

语义搜索 - 新的前沿

DEV Community ·

本研究提出两种新技术，以提高细粒度归因方法在响应与文档相似度度量中的准确性和效率。实验结果表明，这些方法优于以往研究，具有重要的应用潜力。

Fine-Grained Attribution Achieved Through Enhanced Attention Mechanism with Dependency Parsing

BriefGPT - AI 论文速递 ·

本研究探讨了多模态表示学习中的对称 InfoNCE 损失，提出了一种新的相似度度量方法，并通过预训练验证其有效性。结合对比学习与自监督学习，提出多种新方法，显著提升了模型在视觉-语言任务中的性能，尤其在零样本分类和图像文本检索方面表现优异。

使用背景信息非编码匹配的对比学习偏好

BriefGPT - AI 论文速递 ·

本文提出了一种两阶段解码机制，用于自动预测国际疾病分类（ICD）码，利用标签相关性和深度学习模型显著提升编码性能。研究还探讨了基于树编辑距离的相似度度量和掩码训练策略，优化了模型在数据有限情况下的表现。实验结果表明，该方法在识别特定疾病患者方面具有更高的分类性能。

自动医学编码推荐的多阶段检索和再排序模型

BriefGPT - AI 论文速递 ·

本文介绍了多种无需人工干预的数据实体匹配和解析方法，如AutoBlock、ShallowBlocker和DeepER。这些方法利用深度学习和相似度度量技术，在处理不清洁或非结构化数据时表现出色，提高了解析的准确性和效率，适用于多种数据集。

面向实体解析的通用密集阻塞

BriefGPT - AI 论文速递 ·

本文研究视觉概念的复杂度变化，发现高可代表性属性描述视觉概念时，描述长度呈倒U型。使用卷积神经网络进行图像显著性建模，并结合手工特征以提高性能。提出的计算模型揭示了现有视觉识别模型的缺陷，强调自上而下处理的重要性，并探讨了人类与计算机视觉模型在视觉任务中的差异，提出基于概念相似性的图像相似度度量方法。

复杂中的简单

BriefGPT - AI 论文速递 ·

本研究提出了一种基于聚类的框架来检测社交数据流中的谣言，并评估了不同相似度度量的效果。预聚类和异质特征的组合表现最佳，证明了基于相似性的组合方式的有效性。该方法是全自动、无监督的，并可实现流数据的实时检测。

社交梗文化：衡量梗中的语言变异

BriefGPT - AI 论文速递 ·