Sapient Intelligence的分层推理模型(HRM)通过2700万个参数和1000个训练样本,能够解决复杂的数独和迷宫问题。HRM采用潜在空间推理,模仿人脑的层次处理,利用高层和低层变换器模块的交互。模型动态决定思考时间,并通过Q值机制判断何时停止。尽管存在局限性批评,HRM展示了小模型进行复杂推理的潜力。
完成下面两步后,将自动完成登录并继续当前操作。