本研究提出了一种新算法,旨在解决移动边缘计算中深度强化学习资源分配的学习成本问题。该算法动态选择训练时机,使智能体在考虑开销的情况下接近理想性能,具有广泛适用性。
完成下面两步后,将自动完成登录并继续当前操作。