小红花·文摘

vLLM Blog ·

百度推出FastDeploy 2.0，支持高效部署文心4.5等大模型，具备易用性、高性能推理和多硬件兼容性。通过量化技术降低资源需求，提升推理性能，助力企业和研究者应用大模型。

百度大脑 ·

PaddleX 3.0-beta1版本在AI模型部署方面进行了重要升级，提供高性能推理、服务化部署和端侧部署解决方案，以满足多样化的应用需求。高性能推理插件提升了模型推理速度，服务化部署增强了系统灵活性，端侧部署支持在用户设备上运行，确保快速响应和隐私保护。

百度大脑 ·