Dropbox Tech Blog ·

我们如何通过DSPy优化Dash的相关性判断

💡 原文英文，约2600词，阅读约需10分钟。

📝

内容提要

Dropbox Dash整合文件、消息和团队知识，利用DSPy优化相关性判断，提升模型的可靠性和成本效益。通过系统化调整提示，减少与人类评分的偏差，确保输出格式有效，支持大规模数据标注和模型适应。

🎯

关键要点

Dropbox Dash将文件、消息和团队知识整合在一起，提供基于公司上下文的有用答案。
相关性判断是系统的核心能力，影响多个流程，如排名、训练数据生成和离线评估。
通过系统化优化，减少与人类评分的偏差，提高模型的可靠性和成本效益。
使用DSPy框架优化提示，转变为可重复的优化循环，提升相关性判断的质量。
评估相关性判断的标准是与人类评分的偏差，使用归一化均方误差(NMSE)进行测量。
在大规模使用中，选择了更便宜的gpt-oss-120b模型，并通过DSPy优化提示以适应新模型。
DSPy的GEPA优化器通过分析模型与人类的分歧，生成反馈以改进相关性判断。
优化后的提示使NMSE降低了45%，提高了与人类评分的一致性，减少了模型适应时间。
在操作可靠性方面，优化后的模型能够生成有效的JSON输出，减少了格式错误的发生。
通过小范围的增量改进，保持了高性能模型的稳定性，同时提升了与人类评分的对齐度。
DSPy使得相关性评分的优化成为一个可重复的循环，确保在模型演变中保持一致性和可靠性。

🔎

延伸解读

相关性判断的重要性

在Dropbox Dash中，相关性判断是核心能力，直接影响到信息检索的效率和准确性。优化相关性判断不仅能提升用户体验，还能降低成本，确保系统在处理大规模数据时的可靠性。

DSPy的优化优势

DSPy框架通过系统化的提示优化，显著降低了模型与人类评分之间的偏差。优化后的模型在成本和性能上取得了良好平衡，使得在大规模应用中能够快速适应新模型，减少了手动调整的时间和风险。

操作可靠性的挑战

在优化相关性判断时，确保输出格式的有效性同样重要。模型生成的JSON格式必须可读，否则会影响后续的数据处理和评估。因此，优化过程中需关注结构可靠性，以避免因格式错误导致的系统故障。

❓

延伸问答

Dropbox Dash如何整合文件和团队知识？

Dropbox Dash将文件、消息和团队知识整合在一起，提供基于公司上下文的有用答案。

DSPy在优化相关性判断中起什么作用？

DSPy通过系统化优化提示，减少与人类评分的偏差，提高模型的可靠性和成本效益。

如何评估相关性判断的质量？

通过与人类评分的偏差进行比较，使用归一化均方误差(NMSE)来测量模型的评分与人类评分的差异。

优化后的模型在成本和性能上有什么优势？

优化后的模型能够在更低的成本下运行，同时提高了与人类评分的一致性，减少了模型适应时间。

DSPy如何提高模型的操作可靠性？

DSPy优化后，模型的输出格式有效，减少了格式错误的发生，确保输出可以被下游系统读取。

在使用DSPy时，如何避免过拟合？

通过添加明确的保护措施，禁止直接包含特定示例的内容，确保任务定义在优化过程中保持稳定。

🏷️

标签

DSPy Dropbox Dash 数据标注模型可靠性相关性判断

➡️

继续阅读

新玩具！PanstarCloud德国法兰克福三网精品优化服务器 2.79美元/月 30%循环优惠
服务器提供商 PanstarCloud 日前推出德国法兰克福数据中心活动，提供精品优化线路服务器 7 折促销， […]
解构Scaling Law：优化、架构、数据的三重奏
训练一个大型的神经网络，最终效果会受到非常多因素的影响，换个优化器，换个模型架构，或者换一个训练集，结果都可能截然不同。在工程实践中，我们将调试这些因素的...
俄罗斯指控Telegram创始人协助(乌兰克)进行恐怖主义活动已发布国际通缉令
#行业资讯俄罗斯指控 Telegram 创始人帕维尔杜罗夫协助恐怖主义活动，目前已通过国际刑警组织向杜罗夫发出国际通缉令。俄罗斯称 Telegram 长...
高通和 IDC 说，智能眼镜会是手机之外，最重要的 AI 设备
AI 将会成功智能设备的基础能力。#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。
GPT-5.6自己优化自己实锤了，新的左脚踩右脚已经出现
OpenAI的RSI焚诀，它来了！
李飞飞的世界模型，终于开始训练机器人了
李飞飞老师的World Labs，补了块关键拼图