OpenAI ·

对比预训练的文本和代码嵌入

💡 原文英文，约200词，阅读约需1分钟。

📝

内容提要

预训练的无监督数据生成的文本和代码向量表示在多个任务中表现优异，在线性探测分类中提升了4%和1.8%。在大规模语义搜索中，MSMARCO、Natural Questions和TriviaQA基准分别提高了23.4%、14.7%和10.6%。代码嵌入模型也实现了20.8%的相对提升。

🎯

关键要点

预训练的无监督数据生成的文本和代码向量表示在多个任务中表现优异。
在线性探测分类中，最佳无监督模型相较于之前的最佳无监督和监督文本嵌入模型分别提升了4%和1.8%。
在大规模语义搜索中，文本嵌入模型在MSMARCO、Natural Questions和TriviaQA基准上分别提高了23.4%、14.7%和10.6%。
代码嵌入模型在代码搜索中实现了20.8%的相对提升。

❓

延伸问答

预训练的文本和代码嵌入有什么优势？

预训练的文本和代码嵌入在多个任务中表现优异，尤其在分类和语义搜索中取得了显著提升。

在线性探测分类中，预训练模型的提升幅度是多少？

最佳无监督模型在在线性探测分类中相较于之前的最佳无监督和监督模型分别提升了4%和1.8%。

在大规模语义搜索中，文本嵌入模型的表现如何？

文本嵌入模型在MSMARCO、Natural Questions和TriviaQA基准上分别提高了23.4%、14.7%和10.6%。

代码嵌入模型在代码搜索中实现了什么样的提升？

代码嵌入模型在代码搜索中实现了20.8%的相对提升。

无监督数据生成的嵌入模型与监督模型相比有什么不同？

无监督数据生成的嵌入模型在多个任务中表现更优，且在某些情况下与微调模型的表现相当。

如何评价预训练的文本和代码嵌入的整体效果？

预训练的文本和代码嵌入在多个任务中均表现出色，尤其是在分类和语义搜索方面取得了显著的相对提升。

🏷️

继续阅读

使用Transformers.js和句子嵌入构建语义搜索
本文介绍了如何使用Transformers.js和句子嵌入构建客户端语义搜索引擎，包括句子嵌入的工作原理、余弦相似度的计算、嵌入的生成与缓存，以及可重用的...
阿里开源Open Code Review：一款AI代码评审命令行工具
阿里巴巴开源的Open Code Review（OCR）是一款AI代码审查工具，能够自动审查Git提交和代码变更。它通过分析代码库，识别潜在的空指针、线程...
[开源] 阿里巴巴发布AI驱动的代码审查工具Open Code Review 帮助开发者审查代码
阿里巴巴开源了基于人工智能的代码审查工具Open Code Review（OCR），旨在解决传统审查中的覆盖不全、位置漂移和不稳定等问题。开发者可通过配置...
全球首个机器人训练楼盘开盘：30万套中国住宅，机器人拎包入住
大晓机器人与港中文MMLab推出Kairos-Homeworld，这是首个全屋三维生成与物体级交互框架，利用30万套中国住宅户型数据为机器人提供训练环境。...
MiniCPM5-1B采用RL+OPD训练，多项复杂任务达SOTA；面向复杂医疗业务自动化：医疗智能体评测数据集 CHI-Bench
TACK 是 AI Laboratory for Molecular Engineering 于 2026 年发布的一个标准化知识库数据集与基准测试集，旨...
Miso Labs发布MisoTTS：一款拥有开放权重的80亿情感文本转语音模型
Miso Labs发布了MisoTTS，这是一款拥有80亿参数的文本转语音模型，采用残差矢量量化技术，能够根据文本和音频上下文生成富有表现力的语音。该模型...