小红花·文摘

本研究提出了一种基于在线强化学习的动态权重调整机制，解决实时策略任务评估中的适应性问题，显著提升评估函数在规划算法中的效果，尤其在大地图下计算时间增长控制在6%以内。