小红花·文摘 - 小红花技术领袖俱乐部

HuggingFace CEO力荐，Bengio团队也押注：这个1500美元训出的HRM模型，凭什么火了？

量子位 ·

HRM 架构突破：用仅 2700 万参数和 1000 个训练样本超越最先进的大语言模型

HRM 架构突破：用仅 2700 万参数和 1000 个训练样本超越最先进的大语言模型

Micropaper ·

HRM解析：一个2700万参数的模型，无需链式思维进行推理

Yi's blog ·

王冠开发的27M小模型HRM采用仿脑设计，克服了Transformer的局限性。通过分层循环模块和近似梯度技术，HRM实现了高效推理，准确率超过大型模型。尽管参数较少，HRM在特定任务中表现优异，展现出新架构的潜力。

又是王冠：27M小模型超越o3-mini！拒绝马斯克的00后果然不同

量子位 ·