BriefGPT - AI 论文速递 ·

模糊感知时空稀疏变压器用于视频去模糊

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文介绍了多种视频去模糊方法，包括Flow-Guided Sparse Transformer（FGST）和模糊插值变换器（BiT），它们在不同数据集上表现优异。研究强调了运动信息的重要性，并提出了基于极坐标的Radial Strip Transformer架构，显著提升了去模糊性能。此外，Swin Transformer为骨干的SUNet模型在低光条件下展现了卓越的适应性。

🎯

关键要点

提出了一种新的视频去模糊框架FGST，基于自注意力模块，使用光学流矫正模糊，结果在DVD和GOPRO数据集上优于现有方法。
介绍了一种模糊插值变换器BiT，采用双端监督和多尺度残差Swin transformer模块，在Adobe240数据集上表现出显著优势。
提出了BurstSR体系结构，利用金字塔流引导可变卷积网络和Swin Transformer块，从低分辨率RAW爆发中恢复高质量图像，在NTIRE2022 Burst Super-Resolution Challenge中取得最佳效果。
提出了STDANet方法，考虑图像中的流动信息和像素点的清晰度，显著提高视频去模糊效果。
提出了一种基于极坐标的Radial Strip Transformer架构，解决了旋转运动建模问题，实验结果表明其在图像去模糊任务中的性能优于其他方法。
提出了Swin Transformer为骨干的时空对齐SUNet模型，在低光条件下展现了卓越的适应性，获得最高的PSNR和SSIM值。

❓

延伸问答

FGST框架的主要特点是什么？

FGST框架基于自注意力模块，使用光学流矫正模糊，并通过重复嵌入机制增强长时间依赖关系。

模糊插值变换器BiT在Adobe240数据集上的表现如何？

BiT在Adobe240数据集上展示了显著的优势和对真实模糊场景的泛化能力。

Radial Strip Transformer架构解决了什么问题？

Radial Strip Transformer架构解决了旋转运动建模问题，实验结果表明其在图像去模糊任务中的性能优于其他方法。

STDANet方法如何提高视频去模糊效果？

STDANet方法考虑了图像中的流动信息和像素点的清晰度，从而显著提高了视频去模糊效果。

Swin Transformer在低光条件下的表现如何？

Swin Transformer为骨干的时空对齐SUNet模型在低光条件下展现了卓越的适应性，获得最高的PSNR和SSIM值。

BurstSR体系结构的主要优势是什么？

BurstSR体系结构能够有效地从低分辨率RAW爆发中恢复高质量图像，并在NTIRE2022 Burst Super-Resolution Challenge中取得最佳效果。

🏷️