又一个开源第一!飞桨联合百舸,Stable Diffusion推理速度遥遥领先
AIGC(AI Generated Content),即通过人工智能方法生成内容,是当前深度学习最热门的方向之一。其在绘画、写作等场景的应用也一直层出不穷,其中,AI绘画是大家关注和体验较多的方向。Diffusion系列文生图模型可以实现AI绘画应用,其一经推出就受到广泛关注,开启了一波“全民调教AI作画”的潮流,激起了大量的应用需求。与此同时,百度推出的知识增强跨模态大模型——文心ERNIE-V...
百度飞桨框架通过算子融合、Layout优化、Scheduler优化、推理显存优化等技术,实现了Stable Diffusion模型的推理加速和显存优化,ERNIE-ViLG 2.0文心AI作画大模型的显存占用下降37%,单卡80G A100(SXM4)上,512*512分辨率生成图像(50 iters)推理时延0.76s,推理速度达到68.2 iters/s,显存占用4.6G,飞桨将持续推进AIGC模型、AI对话模型等大模型的优化,助力大模型更全面产业化。