本论文介绍了一种针对不稳定、部分可观测环境下决策的在线隐藏表示学习方法。提出的DHTM算法能够捕捉序列数据关系,并对未来观察作出累积预测,形成继承者表示。实验证明,DHTM算法在时序差异学习方面优于LSTM,并与类似RNN算法相当。DHTM是解决在线隐藏表示学习动态环境挑战的有前途的方法。
本文介绍了一种名为DHTM的在线隐藏表示学习算法,用于处理不稳定、部分可观测的决策环境。该算法基于因子图形式和多组分神经元模型,能够捕捉序列数据关系并对未来观察作出累积预测。实验结果表明,DHTM算法在时序差异学习方面表现优于经典LSTM,并与更高级的类似RNN的算法相当。同时,DHTM是解决在线隐藏表示学习动态环境挑战的一种有前途的方法。
完成下面两步后,将自动完成登录并继续当前操作。