加州大学圣地亚哥分校的Hao AI实验室获得NVIDIA DGX B200系统,提升了大语言模型推理研究。该系统加速了FastVideo和Lmgame基准,推动低延迟LLM服务的探索。研究人员通过分离预填充和解码任务,优化了系统性能,改善了用户体验。
完成下面两步后,将自动完成登录并继续当前操作。