本研究提出了一种基于图神经网络和强化学习的调度框架,利用GNN进行状态图表示和策略学习,并通过PPO算法优化模型。实验结果表明,该模型在工厂调度问题上优于传统方法,具备良好的泛化能力。此外,研究探讨了大型语言模型在自动计划中的应用,提出AI-Copilot以解决商业优化问题,展示了神经符号化方法的潜力。
完成下面两步后,将自动完成登录并继续当前操作。