流式多扩散:基于区域的语义控制下的实时交互生成
通过稳定快速推理技术和重构模型为新提出的多提示流批处理架构,我们提出了 StreamMultiDiffusion,这是第一个基于区域的实时文本到图像生成框架,在单个 RTX 2080 Ti GPU 上实现了 1.57 FPS 的区域文本到图像合成生成速度,比现有解决方案快 10 倍。
研究人员通过稳定快速推理技术和重构模型提出了StreamMultiDiffusion,这是第一个基于区域的实时文本到图像生成框架。该框架在单个RTX 2080 Ti GPU上实现了1.57 FPS的区域文本到图像合成生成速度,比现有解决方案快10倍。