本文介绍了一种名为DHTM的在线隐藏表示学习算法,用于处理不稳定、部分可观测的决策环境。该算法基于因子图形式和多组分神经元模型,能够捕捉序列数据关系并对未来观察作出累积预测。实验结果表明,DHTM算法在时序差异学习方面表现优于经典LSTM,并与更高级的类似RNN的算法相当。同时,DHTM是解决在线隐藏表示学习动态环境挑战的一种有前途的方法。
完成下面两步后,将自动完成登录并继续当前操作。