eBay Tech Blog ·

为电子商务扩展大型语言模型：基于Llama的定制LLM开发

💡 原文英文，约1100词，阅读约需4分钟。

📝

内容提要

这篇文章讨论了eBay如何利用Llama模型开发定制的大型语言模型，以适应电子商务领域。通过结合eBay的数据和第三方模型，eBay创建了高效、可扩展的AI解决方案。文章介绍了训练方法、数据来源及其在电子商务特定基准测试中的性能提升，强调了继续预训练的重要性，以确保模型保留原有知识并增强多语言能力。

🎯

关键要点

eBay利用Llama模型开发定制的大型语言模型，以适应电子商务领域。
eBay结合自身数据和第三方模型，创建高效、可扩展的AI解决方案。
训练大型语言模型的过程耗时且资源密集，因此eBay采用了混合方法。
继续预训练技术用于将电子商务特定知识注入Llama基础模型，避免模型遗忘原有知识。
数据来源包括eBay网站的公共列表和产品评论，以及经过筛选的开放源数据集。
训练使用60个节点和480个GPU，采用Megatron-LM框架进行高效训练。
最终的e-Llama模型在电子商务特定基准测试中表现出约25%的提升，非英语测试中提升约30%。
通过继续预训练，eBay能够利用专有和开放的LLM推动新的AI项目。

❓

延伸问答

eBay是如何利用Llama模型开发定制的大型语言模型的？

eBay结合自身数据和第三方模型，通过继续预训练技术，开发了适应电子商务领域的定制Llama模型。

继续预训练技术在eBay的模型开发中有什么作用？

继续预训练技术用于将电子商务特定知识注入Llama基础模型，避免模型遗忘原有知识。

eBay在训练大型语言模型时使用了哪些数据来源？

数据来源包括eBay网站的公共列表、产品评论以及经过筛选的开放源数据集。

e-Llama模型在电子商务基准测试中的表现如何？

e-Llama模型在电子商务特定基准测试中表现出约25%的提升，非英语测试中提升约30%。

eBay在训练模型时使用了多少计算资源？

训练使用了60个节点和480个GPU，采用Megatron-LM框架进行高效训练。

eBay开发定制LLM的主要挑战是什么？

主要挑战包括训练大型语言模型的高成本、数据安全风险以及对专有数据的微调能力限制。

🏷️

继续阅读

Meta公司放弃开源Llama，转向专有的Muse Spark
Meta公司宣布其新AI模型Muse Spark将取代已被放弃的Llama。Muse Spark采用全新架构，无法与Llama迁移，Llama用户需寻找替...
SKILL快速构建你的Java、Python和Node.js开发环境
本案例介绍如何使用SKILL快速搭建Java、Python和Node.js开发环境，适合个人开发者和高校学生。用户可以通过手动创建或导入技能，一键安装所需...
Spark.NET：一个试图把 Django / Rails 式开发体验带回 .NET 世界的全栈 Web 框架。 - 曦远Code
Spark.NET 是一个全栈 Web 框架，旨在为开发者提供快速的单体式应用开发体验。它整合了 ASP.NET Core 和 EF Core，强调“约定...
【Rust日报】2026-05-01 Rust 原生数据表格组件 uiGrid 发布
Rust 原生数据表格组件 uiGrid 发布一个为 egui 开发的功能丰富的数据表格组件已在 GitHub 开源，采用 MIT 许可证。主要特性 ...
DeepSeek V4 发布没炸场，却靠降价掀起革命？
本文拆解DeepSeek V4连续降价如何改变AI模型使用成本，帮助开发者和低频用户判断是否还要购买Coding Plan或Token Plan。文章围绕...
早报｜苹果：下季度内存成本压力将显著加大/宇树最便宜人形机器发布/5月1日高速车流或创历史纪录
· 三星 Q1 芯片利润暴涨 49 倍，单部门吃掉全集团 94% 营业利润 · 赛力斯一季度卖出 78500 辆新能源车，研发费用同比增长 70.7% ·...