EMIT-Diff:通过文本引导的扩散模型增强医学图像分割
原文中文,约500字,阅读约需2分钟。发表于: 。本文提出了一种用于医学图像合成的新方法,即 EMIT-Diff,它利用最近的扩散概率模型生成逼真且多样化的合成医学图像数据,并确保合成样本符合医学相关约束并保留成像数据的底层结构。在多个数据集上进行的实验证明了 EMIT-Diff 在医学图像分割任务中的有效性,并展示了引入首个文本引导的扩散模型用于通用医学图像分割任务的可行性。
本文介绍了一种名为DiffSegmenter的无需训练的新方法,利用生成式文本到图像条件扩散模型作为高效的开放词汇语义分割器的潜力。该方法通过将输入图像和候选类别输入到预训练条件潜在扩散模型,产生交叉注意力图直接用作分割分数,然后由自注意力图进一步细化和完成分割。实验证明,DiffSegmenter在开放词汇语义分割方面取得了令人印象深刻的结果。