基于变换器的演员-评论家强化学习用于序列感知的服务功能链划分

📝

内容提要

本研究针对6G网络中虚拟化网络功能(VNF)管理中的服务功能链(SFC)划分问题,提出了一种基于变换器的演员-评论家框架。该方法通过自注意机制有效建模VNF之间的复杂依赖关系,提升了训练的稳定性和收敛性,实验证明该框架在长期接受率、资源利用效率和可扩展性方面超越了现有技术。在6G环境下,为智能网络编排提供了一种可扩展且强大的解决方案。

➡️

继续阅读