文本调制扩散模型的交互式多模态图像融合框架
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究提出了Text-DiFuse框架,旨在解决多模态图像融合中的复合降质问题,通过文本调制提升融合性能,实验结果表明其在复杂场景中表现优异。
🎯
关键要点
- 该研究提出了Text-DiFuse框架,旨在解决多模态图像融合中的复合降质问题。
- Text-DiFuse框架基于文本调制扩散模型,首次有效处理图像融合中的复合降质。
- 框架通过将特征级信息整合到扩散过程中,提高融合性能,突出前景对象。
- 实验结果表明,Text-DiFuse在复杂降质场景下实现了最先进的融合性能。
- 在语义分割实验中,Text-DiFuse显著提升了语义性能。
➡️