突破传统限制:OxygenREC--一个基于指令跟随的“快慢思考“电商生成式推荐框架

突破传统限制:OxygenREC--一个基于指令跟随的“快慢思考“电商生成式推荐框架

💡 原文中文,约3900字,阅读约需10分钟。
📝

内容提要

京东零售OxygenREC团队提出了一种新型生成式推荐框架OxygenREC,旨在解决电商推荐系统中的推理能力、延迟、资源效率及多场景适应等问题。该框架结合“快慢思考”模式,实现一次训练多场景部署,显著提升推荐效果和资源利用率。

🎯

关键要点

  • 京东零售OxygenREC团队提出新型生成式推荐框架OxygenREC,解决电商推荐系统中的推理能力、延迟、资源效率及多场景适应问题。
  • OxygenREC结合“快慢思考”模式,实现一次训练多场景部署,提升推荐效果和资源利用率。
  • 推荐系统面临的核心矛盾包括传统多阶段级联推荐系统的目标不一致和误差累积,以及大型语言模型的高延迟和计算成本。
  • OxygenREC框架通过Transformer的Encoder-Decoder结构,生成语义化物品序列,支持快思考和慢思考模式。
  • 慢思考模式生成上下文推理指令,快思考模式在严格延迟下生成推荐序列。
  • OxygenREC通过查询到物品的对齐损失和指令引导检索实现精准指令控制。
  • OxygenREC采用统一奖励映射与策略优化,解决多场景扩展性问题,支持一次训练多场景部署。
  • 团队构建了完整的工程体系,包括统一训练框架和高性能推理引擎xLLM,满足工业级应用需求。
  • OxygenREC在京东多个核心场景的实验中取得显著效果,验证了其在工业级推荐系统中的有效性。
  • OxygenREC在电商场景的在线A/B测试中,所有关键业务指标均有显著提升,证明其商业价值。
  • 未来,OxygenREC团队计划探索基于语言扩散模型的非自回归生成范式和跨场景用户轨迹建模。

延伸问答

OxygenREC框架的主要目标是什么?

OxygenREC框架旨在解决电商推荐系统中的推理能力、延迟、资源效率及多场景适应等问题。

OxygenREC如何实现多场景部署?

OxygenREC通过一次训练多场景部署的方式,结合统一奖励映射与策略优化,解决了多场景扩展性问题。

OxygenREC的快慢思考模式有什么作用?

快思考模式在严格延迟下生成推荐序列,慢思考模式生成上下文推理指令,从而提升推荐的准确性和效率。

OxygenREC在电商场景的测试结果如何?

OxygenREC在京东的在线A/B测试中,所有关键业务指标均有显著提升,证明了其商业价值。

OxygenREC如何解决推理能力与延迟之间的矛盾?

OxygenREC通过将复杂推理过程离线化,确保在线服务的低延迟,同时利用快慢思考模式进行高效推荐。

OxygenREC的工程体系包括哪些部分?

OxygenREC的工程体系包括统一训练框架和高性能推理引擎xLLM,满足工业级应用需求。

➡️

继续阅读