模糊感知时空稀疏变压器用于视频去模糊
内容提要
本文介绍了多种视频去模糊方法,包括Flow-Guided Sparse Transformer(FGST)和模糊插值变换器(BiT),它们在不同数据集上表现优异。研究强调了运动信息的重要性,并提出了基于极坐标的Radial Strip Transformer架构,显著提升了去模糊性能。此外,Swin Transformer为骨干的SUNet模型在低光条件下展现了卓越的适应性。
关键要点
-
提出了一种新的视频去模糊框架FGST,基于自注意力模块,使用光学流矫正模糊,结果在DVD和GOPRO数据集上优于现有方法。
-
介绍了一种模糊插值变换器BiT,采用双端监督和多尺度残差Swin transformer模块,在Adobe240数据集上表现出显著优势。
-
提出了BurstSR体系结构,利用金字塔流引导可变卷积网络和Swin Transformer块,从低分辨率RAW爆发中恢复高质量图像,在NTIRE2022 Burst Super-Resolution Challenge中取得最佳效果。
-
提出了STDANet方法,考虑图像中的流动信息和像素点的清晰度,显著提高视频去模糊效果。
-
提出了一种基于极坐标的Radial Strip Transformer架构,解决了旋转运动建模问题,实验结果表明其在图像去模糊任务中的性能优于其他方法。
-
提出了Swin Transformer为骨干的时空对齐SUNet模型,在低光条件下展现了卓越的适应性,获得最高的PSNR和SSIM值。
延伸问答
FGST框架的主要特点是什么?
FGST框架基于自注意力模块,使用光学流矫正模糊,并通过重复嵌入机制增强长时间依赖关系。
模糊插值变换器BiT在Adobe240数据集上的表现如何?
BiT在Adobe240数据集上展示了显著的优势和对真实模糊场景的泛化能力。
Radial Strip Transformer架构解决了什么问题?
Radial Strip Transformer架构解决了旋转运动建模问题,实验结果表明其在图像去模糊任务中的性能优于其他方法。
STDANet方法如何提高视频去模糊效果?
STDANet方法考虑了图像中的流动信息和像素点的清晰度,从而显著提高了视频去模糊效果。
Swin Transformer在低光条件下的表现如何?
Swin Transformer为骨干的时空对齐SUNet模型在低光条件下展现了卓越的适应性,获得最高的PSNR和SSIM值。
BurstSR体系结构的主要优势是什么?
BurstSR体系结构能够有效地从低分辨率RAW爆发中恢复高质量图像,并在NTIRE2022 Burst Super-Resolution Challenge中取得最佳效果。