本研究提出了P/D-Serve系统,解决了在大规模语言模型上的性能可靠性问题。通过P/D组织和动态调整策略,提高了处理效率,实现了吞吐量、首次返回时间和D2D传输时间的显著提升,展现出吞吐量增长潜力。
完成下面两步后,将自动完成登录并继续当前操作。