本文研究了增强学习中的稀疏表示,通过比较标准神经网络和具有稀疏性质的神经网络,在控制策略学习中证明了稀疏表示的有效性。同时,提出了一种名为“分布式正则化器”的方法来鼓励隐藏节点的激活匹配分布,从而产生稀疏的激活状态。
完成下面两步后,将自动完成登录并继续当前操作。