小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
探索RTEB:评估嵌入模型的新基准

随着大型语言模型的发展,基准测试成为评估其性能的重要标准。MTEB是用于嵌入模型的通用基准,但存在过拟合问题。RTEB作为新基准,专注于真实检索任务,结合公共和私有数据集,提供更准确的评估,适用于多种行业和语言。

探索RTEB:评估嵌入模型的新基准

The New Stack
The New Stack · 2025-11-10T18:00:52Z
驶入新的嵌入空间:分析多语言模型中模型干预引发的跨语言对齐

多语言大模型中的跨语言表示对齐能提升跨语言任务性能。传统对齐方法需大量计算资源和数据,而模型干预是一种更高效的替代方案。我们分析了一种流行的干预方法(寻找专家),发现通过操控神经元可增强跨语言对齐,检索任务性能最高可提高2倍准确率。

驶入新的嵌入空间:分析多语言模型中模型干预引发的跨语言对齐

Apple Machine Learning Research
Apple Machine Learning Research · 2025-07-25T00:00:00Z
介绍 voyage-context-3:聚焦块级细节与全局文档上下文

voyage-context-3是一种新型上下文化块嵌入模型,能够在无需手动元数据的情况下捕捉文档完整上下文。与传统模型相比,它在块级和文档级检索任务中表现更优,提升了检索准确性并降低存储成本。该模型简化了技术架构,支持多维度和量化选项,适用于长文档和高敏感度检索任务。

介绍 voyage-context-3:聚焦块级细节与全局文档上下文

MongoDB
MongoDB · 2025-07-23T18:47:00Z

本研究针对教育场景中的模糊性问题,提出了多样化表达检索任务,并引入了包含24000对查询的STEM教育检索数据集(SER)。Uni-Retrieval在检索任务中表现出色,提供了可扩展且精确的解决方案。

Uni-Retrieval: A Diverse Style Framework for STEM Education Retrieval

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-09T00:00:00Z
什么是块大小和块重叠

块大小指单个块中允许的最大字符或标记数,块重叠则是相邻块共享的字符或标记数,以确保重要上下文不丢失。通过编程可以有效地将文本分块,适用于嵌入模型和检索任务。

什么是块大小和块重叠

DEV Community
DEV Community · 2024-12-13T02:23:32Z
Jina CLIP v2:用于文本和图像的多语言多模态嵌入

jina-clip-v2是新发布的多模态嵌入模型,支持89种语言,图像分辨率提升至512x512,性能较v1提高3%。该模型结合文本和视觉编码器,适用于多种检索任务,表现优异。

Jina CLIP v2:用于文本和图像的多语言多模态嵌入

Jina AI
Jina AI · 2024-11-21T16:29:45Z

我们推出了波兰信息检索基准(PIRB),包含41个波兰语检索任务和10个新数据集。评估了20多个模型,并引入稀疏-密集混合检索器,通过三步训练提升效果。新训练的文本编码器使密集模型优于现有方案,混合方法进一步提高性能。

使用OKAPI BM25和交叉编码器集成的波兰文本检索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-06T00:00:00Z

本研究提出了一种新的文档嵌入方法,结合文档及其邻近文档的上下文,通过对比学习和新架构提升检索效果。在多个场景中优于现有双编码器,尤其在领域外表现突出,并在MTEB基准测试中取得了领先结果。

上下文文档嵌入

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

研究提出了一种新方法卷积信号传播(CSP),解决了图学习在超图上的不足。CSP是一种简单可扩展的非参数方法,能直接在超图上操作,特别适用于节点分类和检索任务,计算复杂度低,是超图任务的理想选择。实验显示,CSP在多个领域的数据集上表现出色。

卷积信号传播:一种简单且可扩展的超图算法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z

研究人员引入了MobileCLIP,一种新的高效图像-文本模型系列,通过多模态增强训练方法实现了零样本分类和检索任务的新的最佳延迟-准确性权衡。

MobileCLIP: 多模态加强训练的快速图像 - 文本模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-28T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码