京东科技开发者 ·

突破传统限制：OxygenREC--一个基于指令跟随的“快慢思考“电商生成式推荐框架

💡 原文中文，约3900字，阅读约需10分钟。

📝

内容提要

京东零售OxygenREC团队提出了一种新型生成式推荐框架OxygenREC，旨在解决电商推荐系统中的推理能力、延迟、资源效率及多场景适应等问题。该框架结合“快慢思考”模式，实现一次训练多场景部署，显著提升推荐效果和资源利用率。

🎯

🔎

OxygenREC框架通过引入快慢思考模式，解决了推荐系统中推理能力与延迟之间的矛盾。慢思考模式进行深度推理，生成上下文指令，而快思考模式则在严格的延迟要求下快速生成推荐。这种设计不仅提升了推荐的准确性，也确保了用户体验的流畅性，适应了电商场景的高效需求。

OxygenREC的设计理念是一次训练、多场景部署，避免了传统推荐系统中为每个场景独立建模的高成本。这种统一模型的策略不仅降低了资源消耗，还提高了模型在不同场景间的迁移能力，确保了推荐效果的一致性和稳定性，适合大规模电商平台的应用。

在工业级应用中，OxygenREC面临着处理TB级稀疏特征与十亿级稠密参数的挑战。团队通过构建高性能推理引擎xLLM和统一训练框架，确保了模型在大流量下的稳定性和高效性。这种系统工程的设计为其他行业的生成式AI应用提供了重要的参考。

❓

OxygenREC框架旨在解决电商推荐系统中的推理能力、延迟、资源效率及多场景适应等问题。

OxygenREC通过一次训练多场景部署的方式，结合统一奖励映射与策略优化，解决了多场景扩展性问题。

快思考模式在严格延迟下生成推荐序列，慢思考模式生成上下文推理指令，从而提升推荐的准确性和效率。

OxygenREC在京东的在线A/B测试中，所有关键业务指标均有显著提升，证明了其商业价值。

OxygenREC通过将复杂推理过程离线化，确保在线服务的低延迟，同时利用快慢思考模式进行高效推荐。

OxygenREC的工程体系包括统一训练框架和高性能推理引擎xLLM，满足工业级应用需求。

🏷️