量子位 ·

中科大华为发布生成式推荐大模型，昇腾NPU可部署，背后认知一同公开

💡 原文中文，约2500字，阅读约需6分钟。

📝

内容提要

中科大与华为合作发布的生成式推荐大模型成功在昇腾NPU上部署，基于扩展定律提升推荐系统性能，适用于复杂场景和排序任务，展现良好扩展性。未来研究将集中于数据工程和训练效率等方向。

🎯

❓

该模型成功在昇腾NPU上部署，具备扩展定律，适用于复杂场景和排序任务，展现良好扩展性。

扩展定律描述了模型性能与参数规模、数据集规模和训练资源之间的幂律关系，通过增加模型深度和宽度可以提升推荐效果。

HSTU在多域、多行为和辅助信息等复杂场景中表现优异，尤其在多域联合建模上优于基线模型SASRec和C2DSR。

生成式推荐大模型在排序任务中显著优于传统模型DIN，尽管在小规模模型下Llama表现更好，但HSTU在扩展性方面更具优势。

未来研究将集中于数据工程、Tokenizer和训练推理效率等方向，以解决当前挑战并拓宽应用场景。

HSTU在扩展性方面表现优异，尤其在参数扩展时性能显著提升，而GPT和SASRec的扩展性不足。

🏷️

派早报：Google 相关资讯三则、华为发布智慧屏 S7 X Pro等
谷歌推出基于AI的应用Dreambeans，整合用户的Google服务信息，生成生活灵感内容，鼓励用户回归现实生活。该应用目前仅面向美国的Google A...
谷歌800亿融资，巴菲特久违接盘，背后有什么鬼故事？
谷歌融资847.5亿美元并停止股票回购，以应对未来挑战并囤积现金。巴菲特的伯克希尔哈撒韦投资100亿美元，显示市场对AI的信心。科技巨头们纷纷转向AI基础...
KVarN：华为用于KVCache量化的原生vLLM后端
华为开源的KVarN是一种KV Cache量化技术，通过Hadamard旋转和双轴方差归一化，有效解决大模型推理中的显存瓶颈。该技术在2-bit量化下保持...
Why Zig Isn’t 1.0 (Yet)
Most programming languages follow a familiar trajectory: early experimental r...
Why isn’t the Trump phone made in the USA?
Where's the Trump phone? We're going to keep talking about it every w...
This chunky little tablet got my kid to clean up his toys
Never underestimate the power that a cheap tablet holds over a kid under six....