本研究提出了一种在小波域进行多尺度生成建模的方法,有效解决了传统空间域生成模型中的分数病态问题,显著提升了性能,并减少了可训练参数和时间。
本文针对卷积神经网络(CNN)的过拟合问题,提出了一种新颖的正则化方法——谱小波 dropout(SWD),通过在特征图的离散小波分解中随机丢弃详细频带,提高模型的泛化能力。与现有的傅里叶 dropout 方法相比,SWD 使用单一超参数,并在多个基准测试中表现出更低的计算复杂性与更优的性能。
本文提出了一种用于红外小目标检测的扩散模型框架,通过模拟像素级判别与掩模后验分布建模相结合,转变了从判别范式到生成范式的方法,以绕过目标级的不敏感性,并设计了小波域中的低频隔离以抑制内在红外噪声对扩散噪声估计的干扰。实验证明,该方法在NUAA-SIRST、IRSTD-1k和NUDT-SIRST数据集上具有竞争性的性能优势。
本文提出了一种新颖的DiWa方法,用于SISR,结合了DDPMs和DWT,实现在小波频谱上为超分辨图像产生高频信息,从而生成高质量、详细的重建。该方法在定量指标上优于当前最先进的扩散SISR方法,同时使用更少的参数和节省推理时间。
我们通过将生成目标定向到小波领域,将自波领域生成模型的训练和推理速度提升一倍,在语音合成任务中实现与原模型相媲美或更高的性能,并且证明了该方法的多功能性。
本文介绍了XVFI-Net,一种用于处理4K视频的极端VFI网络。该网络采用递归多尺度共享结构,由两个级联模块组成,用于学习双向光流。实验结果显示,XVFI-Net在处理具有极端运动和复杂纹理的对象时表现出了极高的VFI性能。
完成下面两步后,将自动完成登录并继续当前操作。