基于层次变分自编码器的图像传输学习

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该文章介绍了DiffJSCC框架,利用预训练的文本到图像扩散模型提高信道传输图像的逼真度。实验证明该方法在感知度量方面优于常规方法和深度联合源信道编码方法,尤其在差信道条件和有限带宽下表现出色。DiffJSCC能以每像素不到0.008个符号的速度对768x512像素的Kodak图像进行高度逼真的重建。

🎯

关键要点

  • 提出了一种名为DiffJSCC的新框架,利用预训练的文本到图像扩散模型。
  • DiffJSCC旨在增强信道传输图像的逼真度。
  • 该框架通过微调稳定扩散模型,利用空间和文本特征以及信道状态信息。
  • 实验证明DiffJSCC在感知度量方面显著优于常规方法和深度联合源信道编码方法。
  • DiffJSCC在信道条件差和带宽有限的情况下表现出色。
  • 在1dB信噪比下,DiffJSCC能以每像素不到0.008个符号的速度重建768x512像素的Kodak图像。
➡️

继续阅读