小红花·文摘

本研究提出了一种基于图神经网络和强化学习的调度框架，利用GNN进行状态图表示和策略学习，并通过PPO算法优化模型。实验结果表明，该模型在工厂调度问题上优于传统方法，具备良好的泛化能力。此外，研究探讨了大型语言模型在自动计划中的应用，提出AI-Copilot以解决商业优化问题，展示了神经符号化方法的潜力。