小红花·文摘

探索RTEB：评估嵌入模型的新基准

The New Stack ·

本文评估了多种文本嵌入模型，包括波兰语和其他语言的基准测试。研究表明，没有单一模型在所有任务中表现最佳，强调了通用文本嵌入方法的必要性。同时，提出了新的评估框架和模型，展示了在特定领域的性能提升。

搜索引擎RAG召回效果评测MTEB介绍与使用入门 - JadePeng

博客园 - JadePeng ·

《MTEB: Massive Text Embedding Benchmark(海量文本嵌入基准)》评估了海量文本嵌入模型，包含8个语义向量任务，涵盖58个数据集和112种语言。通过测试33个模型发现，没有一种特定的文本嵌入方法在所有任务中占主导地位。中文海量文本embedding任务排行榜包括Retrieval、STS、PairClassification、Classification、Reranking和Clustering。m3e模型使用in-batch负采样的对比学习方式进行训练，使用了指令数据集和Roberta系列模型。bge模型采用高效预训练和大规模文本微调，使用了RetroMAE预训练算法和难负样本挖掘方法。

一文通透Text Embedding模型：从text2vec、openai-text embedding到m3e、bge

结构之法算法之道 ·

MTEB: Massive Text Embedding Benchmark

Hugging Face - Blog ·

探索RTEB：评估嵌入模型的新基准

PL-MTEB：波兰大规模文本嵌入基准

搜索引擎RAG召回效果评测MTEB介绍与使用入门 - JadePeng

一文通透Text Embedding模型：从text2vec、openai-text embedding到m3e、bge

MTEB: Massive Text Embedding Benchmark