小红花·文摘

本文介绍了一种名为DiffSegmenter的无需训练的新方法，利用生成式文本到图像条件扩散模型作为高效的开放词汇语义分割器的潜力。该方法通过将输入图像和候选类别输入到预训练条件潜在扩散模型，产生交叉注意力图直接用作分割分数，然后由自注意力图进一步细化和完成分割。实验证明，DiffSegmenter在开放词汇语义分割方面取得了令人印象深刻的结果。