小红花·文摘

谷歌推出语音到检索（S2R）技术，无需先将语音转为文本即可检索信息

实时互动网 ·

通过Mobile-VideoGPT的创新框架解锁实时视频分析！

DEV Community ·

该研究探讨了双编码器在信息检索中的应用，提出结合双编码器与注意力结构的神经模型，以提高检索精度。同时，介绍了无监督训练的密集感知器和稀疏表达的SPLADE检索器，证明其在效率和效果上的优势。此外，提出了新颖的稀疏技术和学习稀疏检索方法，显著提升了检索性能。

朝着竞争性搜索相关性的无推理学习稀疏检索器

BriefGPT - AI 论文速递 ·

该研究提出上下文文档嵌入，通过双编码器架构捕捉文档的语义和上下文信息，提升文本分析效果。双编码器分别处理文档内容和上下文信息，利用对比损失函数优化，生成更准确的文档表示。实验显示，该方法在文本检索和分类任务中优于传统方法，但对显式上下文元数据的依赖可能限制应用，未来可探索隐式方法增强鲁棒性。

通过上下文文档嵌入捕捉语义和上下文以提升文本分析

DEV Community ·

本文研究了任务导向对话系统中的超范围意图识别，提出了DETER框架，利用双编码器和阈值重新分类机制，显著提升了检测性能。同时探讨了大型语言模型在意图分类中的优势与挑战，并提出改进建议。

在大型语言模型时代的意图检测

BriefGPT - AI 论文速递 ·

本文介绍了多种基于文本的自然语言人物检索方法，采用注意力机制、双编码器和跨模态匹配等技术，显著提升了检索精度。这些方法在多个数据集上表现优异，推动了监控视频检索领域的发展。

AMNS：基于注意力加权的选择性掩膜和噪声标签抑制用于文本到图像的人物检索

BriefGPT - AI 论文速递 ·

本文介绍了一种利用双编码器和掩码边界软最大损失进行音频字幕自动生成的方法。研究在多个数据集上显著提升了性能，提出了基于公共工具的音频说明生成流程，并构建了包含190万个音频文本对的数据集。通过弱监督方法，减少了对配对数据的需求，验证了模型的有效性。

估计音频-标题对应关系改善基于语言的音频检索

BriefGPT - AI 论文速递 ·

本文介绍了一种基于树增强跨模态编码的方法，以提高视频检索性能。通过双编码器和跨注意力变压器，结合视觉与文本特征，提升了检索的准确性和可扩展性。此外，研究提出了全局-局部对齐方法和HiSE模型，优化了文本到视频的检索任务，实验结果在多个基准测试中表现优越。

T2VIndexer：一种高效文本-视频检索的生成视频索引器

BriefGPT - AI 论文速递 ·

延迟交互模型，为什么是下一代RAG的标配？

机器之心 ·

这篇论文探讨了多种基于视觉和语音的模型，旨在提升低资源语言的语音理解和图像字幕生成能力。研究采用双编码器、改进的神经网络和多任务学习等方法，显著提高了性能，尤其在图像与语音结合方面，展示了语音识别和翻译的有效性。

仅使用图像进行语音翻译

BriefGPT - AI 论文速递 ·

该研究提出了一个两阶段模型，通过常规向量距离度量和双编码器体系结构优化文本检索性能。采用稀疏矩阵因子分解和轻量级RBT模块，显著提高了检索速度和召回率，特别是在视觉搜索和实体链接任务中表现优异。

邻居应用连带多个候选项的比较：实现高效和有效的检索

BriefGPT - AI 论文速递 ·

本研究开发了一种高效的淋巴瘤分割方法，结合18F-氟脱氧葡萄糖正电子发射断层扫描与计算机断层扫描，利用视觉转换器和双编码器，显著提升了图像分割的效率和准确性，同时提出了局部掩码重建机制和基于原型的Transformer架构。

基于多尺度局部视场特征重建的高效预训练模型应用于 PCB CT 图像元素分割

BriefGPT - AI 论文速递 ·

本研究提出了一种基于BERT的双编码器模型，显著提升了生物医学实体链接的效率和准确性。通过无监督学习和多语言模型，系统的召回率和F1得分得到了显著提高。此外，介绍了MedCAT工具，能够有效提取和链接医学概念，适用于临床分析。

本文比较了双编码器和交叉编码器的差异，双编码器适合搜索，速度快且可扩展性强，交叉编码器适合分类和高精度排名，更准确。双编码器独立编码每个句子，将输入文本编码为固定长度向量，而交叉编码器同时对两个句子进行编码，能捕获句子之间的关系。在实践中，可以先使用双编码器减少候选数量，再使用交叉编码器获取最终结果。交叉编码器可用于语义相似性任务。通过两阶段检索和重新排序系统，可以在实践中使用双编码器和交叉编码器。

什么是句子嵌入、交叉编码器和重新排名

极道 ·

本研究使用双编码器和跨注意力的视觉文本变压器方法进行基于语言的搜索，提高了检索准确性和可扩展性。在Flickr30K图像数据集和VATEX视频数据集上进行了验证。

文本 - 视频检索中的单查询后处理的 Sinkhorn 变换

BriefGPT - AI 论文速递 ·

该研究提出了一种新的方法，使用双编码器对比有序学习框架，将腹主动脉钙化量化为有序回归问题，并预测未来心血管事件的风险。在两个临床数据集上评估，具有高灵敏度和高准确性。

常规血管造影过程中腹主动脉 CT 密度的造影剂诱导决定性成分：概念验证研究

BriefGPT - AI 论文速递 ·

该文介绍了一种新的多语言实体链接公式，使用面向语言不可知的知识库解析语言特定的提及。作者训练了一个双编码器，以获得单个实体检索模型，覆盖了100多种语言和2000万个实体。该模型在跨语言链接任务中表现优异，但仍面临着罕见实体和低资源语言的挑战。作者提出了一个新的大型多语言数据集Mewsli-9，以帮助增强模型和训练。

DBLPLink：DBLP 学术知识图谱的实体链接器

BriefGPT - AI 论文速递 ·

相似不等于相关：两种编码器破解向量数据库的真正短板

RAG重排序解析：更好的上下文，更好的答案

在增强检索生成（RAG）语义缓存中减少假阳性：银行案例研究

谷歌推出语音到检索（S2R）技术，无需先将语音转为文本即可检索信息

通过Mobile-VideoGPT的创新框架解锁实时视频分析！

朝着竞争性搜索相关性的无推理学习稀疏检索器

通过上下文文档嵌入捕捉语义和上下文以提升文本分析

在大型语言模型时代的意图检测

AMNS：基于注意力加权的选择性掩膜和噪声标签抑制用于文本到图像的人物检索

估计音频-标题对应关系改善基于语言的音频检索

T2VIndexer：一种高效文本-视频检索的生成视频索引器

延迟交互模型，为什么是下一代RAG的标配？

仅使用图像进行语音翻译

邻居应用连带多个候选项的比较：实现高效和有效的检索

基于多尺度局部视场特征重建的高效预训练模型应用于 PCB CT 图像元素分割

ClinLinker：西班牙语临床概念提及的医学实体链接

什么是句子嵌入、交叉编码器和重新排名

文本 - 视频检索中的单查询后处理的 Sinkhorn 变换

常规血管造影过程中腹主动脉 CT 密度的造影剂诱导决定性成分：概念验证研究

DBLPLink：DBLP 学术知识图谱的实体链接器