小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
DoorDash如何构建评估大型语言模型的测试系统

DoorDash开发了一种模拟和评估系统,以改善客户支持聊天机器人,成功解决了“幻觉”问题。该系统通过离线模拟生成真实客户对话,并自动评估聊天机器人的表现。经过快速迭代,幻觉现象减少了90%,测试效率显著提高,确保在真实客户体验前验证改进效果。尽管存在一些局限性,如无法捕捉所有问题,人工审核仍是改进的起点。

DoorDash如何构建评估大型语言模型的测试系统

ByteByteGo Newsletter
ByteByteGo Newsletter · 2026-05-30T15:30:52Z

Using Copilot along with strong reliability safeguards, DoorDash migrated their iOS XCTest-based test suite to Swift Testing, thus modernizing a large test suite quickly, safely, and with...

DoorDash Used Copilot to Convert Its XCTest-Based iOS Test Suite to Swift Testing

InfoQ
InfoQ · 2026-05-04T10:00:00Z
DoorDash如何在一周内推出新国家

DoorDash通过模块化设计快速推出Dasher入职流程,简化了不同市场的适应性。新架构显著缩短了在波多黎各、澳大利亚和加拿大的上线时间,且无需大量新开发。通过标准化接口和状态映射,DoorDash实现了高效的流程管理和灵活的模块重用。

DoorDash如何在一周内推出新国家

ByteByteGo Newsletter
ByteByteGo Newsletter · 2026-04-21T15:30:21Z

Sudeep Das and Pradeep Muthukrishnan explain the shift from static merchandising to dynamic, moment-aware personalization at DoorDash. They share how LLMs generate natural-language "consumer...

Presentation: Dynamic Moments: Weaving LLMs into Deep Personalization at DoorDash

InfoQ
InfoQ · 2026-04-21T10:35:00Z

DoorDash has launched a multimodal machine learning system that aligns product images, text, and user queries in a shared embedding space. Trained on 32 million labeled query-product pairs using...

DoorDash Builds DashCLIP to Align Images, Text, and Queries for Semantic Search Using 32M Labels

InfoQ
InfoQ · 2026-03-16T14:25:00Z
DoorDash构建LLM对话模拟器,以大规模测试客服聊天机器人

DoorDash开发了一种模拟评估系统,能够快速进行数百次客服聊天机器人测试,显著提高实验效率。该系统将幻觉率降低了约90%,通过生成真实客户互动的多轮对话,结合自动评估框架,确保聊天机器人在实际场景中的表现。工程师通过持续迭代优化提示和上下文处理,以达到上线前的评估标准。

DoorDash构建LLM对话模拟器,以大规模测试客服聊天机器人

InfoQ
InfoQ · 2026-03-13T14:12:00Z
面向全球规模的架构:深入了解DoorDash统一的可组合Dasher入职平台

DoorDash重建了Dasher入职系统,采用统一的模块化工作流程平台,以加速全球扩展并简化地区复杂性。新系统取代了旧的分散架构,提供一致的入职体验,减轻工程负担,并支持不同市场的本地化需求。迁移过程验证了新系统的可移植性,未来可能增加动态配置和版本管理功能。

面向全球规模的架构:深入了解DoorDash统一的可组合Dasher入职平台

InfoQ
InfoQ · 2026-03-06T15:00:00Z
通过多臂老虎机优化DoorDash的A/B测试

DoorDash工程师采用多臂老虎机方法优化实验,解决传统A/B测试的慢和昂贵问题。该方法通过动态分配流量加速学习并减少浪费,核心算法为汤普森采样,能够有效处理延迟反馈。尽管多臂老虎机面临挑战,如难以推断未包含在奖励函数中的指标,DoorDash计划通过上下文老虎机和贝叶斯优化提升用户体验。

通过多臂老虎机优化DoorDash的A/B测试

InfoQ
InfoQ · 2026-01-25T13:00:00Z
DoorDash在聊天和通话中应用AI安全技术,事件发生率降低50%

DoorDash推出了AI安全系统SafeChat,实时监控Dashers与客户的交流,检测不当内容并采取措施。该系统结合机器学习与人工审核,显著降低安全事件发生率。

DoorDash在聊天和通话中应用AI安全技术,事件发生率降低50%

InfoQ
InfoQ · 2026-01-23T15:00:00Z
DoorDash如何迁移到服务网格以处理每秒8000万次请求

DoorDash在经历服务中断后,采用服务网格架构以提升可靠性,选择Envoy作为数据平面,并构建定制控制平面。通过逐步引入关键功能,DoorDash成功应用服务网格于微服务架构,显著改善系统可见性和可靠性。

DoorDash如何迁移到服务网格以处理每秒8000万次请求

ByteByteGo Newsletter
ByteByteGo Newsletter · 2025-12-05T16:30:42Z
DoorDash问题:AI浏览器如何对亚马逊构成巨大威胁

文章讨论了“DoorDash问题”,即AI界面如何影响服务提供商与用户的关系。AI可能导致用户通过代理下单,从而削弱传统服务商与客户的直接联系,影响其收入模式。亚马逊近期起诉Perplexity,阻止其AI浏览器在亚马逊上购物,标志着这一问题的首次重大对抗。AI的崛起可能改变互联网经济,服务商需重新审视与客户的关系。

DoorDash问题:AI浏览器如何对亚马逊构成巨大威胁

The Verge
The Verge · 2025-11-20T15:30:00Z
我如何利用一个混乱的DoorDash数据集构建数据清理管道

根据CrowdFlower的调查,数据科学家花60%的时间在数据整理和清理上。本文介绍了如何利用DoorDash的近20万条食品配送记录构建数据清理管道,处理缺失值和数据类型问题,为后续分析做好准备。

我如何利用一个混乱的DoorDash数据集构建数据清理管道

KDnuggets
KDnuggets · 2025-10-16T16:43:42Z
DoorDash将在凤凰城使用Waymo的无人驾驶出租车进行送餐

DoorDash与Waymo在凤凰城合作,使用无人驾驶汽车进行送餐。顾客需到路边取餐,Waymo的无人车将从DashMart便利店配送,未来将扩展至更多商家,以降低人力成本和提升送餐效率。

DoorDash将在凤凰城使用Waymo的无人驾驶出租车进行送餐

The Verge
The Verge · 2025-10-16T13:00:00Z
DoorDash如何利用人工智能模型理解餐厅菜单

DoorDash利用大型语言模型(LLMs)自动将餐厅菜单照片转化为结构化数据,解决菜单更新问题。团队设计了“护栏模型”,确保转录的准确性,结合OCR与LLM的优点,提高了效率和准确性。

DoorDash如何利用人工智能模型理解餐厅菜单

ByteByteGo Newsletter
ByteByteGo Newsletter · 2025-09-10T15:30:09Z
与DoorDash首席产品官Mariana Garavaglia的问答

DoorDash通过AI提升员工体验和工作效率,强调AI应增强人类判断而非取代。HR团队致力于提高员工的AI素养,推动自主学习和个性化发展。AI工具帮助员工自动化工作、分析数据,促进技术创新,推动公司转型。

与DoorDash首席产品官Mariana Garavaglia的问答

OpenAI
OpenAI · 2025-08-18T00:00:00Z
DoorDash推出基于配置的徽章框架以解耦UI逻辑

DoorDash推出徽章服务框架(BSF),通过后端配置管理徽章,简化UI逻辑,提升跨平台一致性。BSF支持快速实验和A/B测试,无需等待应用更新,显著提高徽章部署速度和开发流程的一致性。

DoorDash推出基于配置的徽章框架以解耦UI逻辑

InfoQ
InfoQ · 2025-08-08T09:00:00Z
DoorDash将Snowflake打造成实时ERP系统

DoorDash通过Snowflake构建实时财务数据中心,提升会计系统效率。集中数据后,分析师能快速获取信息,审计时间缩短至10分钟,财务关闭周期减至4天,节省大量人力,实现实时决策。

DoorDash将Snowflake打造成实时ERP系统

The New Stack
The New Stack · 2025-07-10T14:00:41Z
一名DoorDash送餐员如何诈骗公司250万美元

一名前DoorDash送餐员因参与超过250万美元的诈骗被判有罪。他利用虚假客户账户和员工凭证伪造订单,涉及五人。送餐员面临20年监禁和25万美元罚款。

一名DoorDash送餐员如何诈骗公司250万美元

The Verge
The Verge · 2025-05-17T18:27:25Z
DoorDash自建搜索引擎如何实现延迟降低50%

QA Wolf的AI服务可在几周内实现80%的自动化测试覆盖,支持多设备和手势交互,测试周期缩短至15分钟,帮助工程团队加速发布。

DoorDash自建搜索引擎如何实现延迟降低50%

ByteByteGo Newsletter
ByteByteGo Newsletter · 2025-04-22T15:30:27Z
DoorDash在美国扩展人行道机器人送餐服务

DoorDash与Coco在洛杉矶和芝加哥推出自动送餐机器人,已有近600家商家参与,旨在实现多模式配送,减少对传统车辆的依赖。同时,DoorDash也在尝试无人机配送,已完成10万次机器人送餐。

DoorDash在美国扩展人行道机器人送餐服务

The Verge
The Verge · 2025-04-11T17:07:34Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码