小红花·文摘

本文介绍了一种名为DHTM的在线隐藏表示学习算法，用于处理不稳定、部分可观测的决策环境。该算法基于因子图形式和多组分神经元模型，能够捕捉序列数据关系并对未来观察作出累积预测。实验结果表明，DHTM算法在时序差异学习方面表现优于经典LSTM，并与更高级的类似RNN的算法相当。同时，DHTM是解决在线隐藏表示学习动态环境挑战的一种有前途的方法。