小红花·文摘

本文介绍了多区域神经元网络模型及其新突触可塑性学习规则，结合DNN和SOM的CTDL算法，提出了深度增强学习方法QXplore，探讨了TD学习在强化学习中的作用，并提出了广义潜在均衡框架以实现高效信用赋值，旨在促进机器学习与神经科学的结合。