该研究提出了一种基于Transformer-Mamba模块和可学习小波变换的扩散模型,将符号音乐表示为钢琴卷轴,显著提高了音乐生成的质量和可控性。
本研究提出了WaveHiTS模型,结合小波变换和神经分层插值,解决了风向预测中的循环特性和误差累积问题。该模型在真实气象数据上表现优于多种深度学习模型,显著提高了预测精度和稳定性,对风能利用和电网整合具有重要意义。
本研究提出了一种基于深度学习的比特币价格预测模型,采用小波变换去除噪声,显著提高了预测精度。结果表明,该模型在不同时间段的价格预测中优于现有模型,最低预测误差为0.58%。
本研究提出了一种基于小波变换的人脸表情操控方法WEM-GAN,旨在解决表情标签控制导致的面部特征细节丧失问题。通过结合小波变换与U-net自编码器,提升了面部特征的保存,并利用高频成分鉴别器和对抗损失提高了生成图像的质量与身份保持能力。实验结果表明,该方法在AffectNet数据集上优于以往技术。
本研究提出了一种新颖的状态空间架构,结合小波变换,提升了传统扩散模型在图像生成中的局部特征感知能力。实验结果表明,该方法在基准测试中优于现有模型,训练收敛更快,输出质量更高。
我们提出了SFFNet框架,通过两阶段网络设计,结合空间和频域特征,解决遥感图像灰度变化问题。引入小波变换特征分解器和多尺度双重表示对齐滤波器,实验结果表明其在mIoU指标上优于现有方法。
研究者尝试通过增加CNN的卷积核大小来模拟ViTs的全局感受野,但效果有限。论文提出用小波变换(WT)实现大感受野,避免过参数化。新方法WTConv层可替代现有架构,提升多频响应能力,适用于图像分类和语义分割。WTConv通过小波分解和小卷积核扩展感受野,参数增长缓慢,增强对低频信息的响应,提高CNN的鲁棒性和形状识别能力。
该研究提出WTCL-Dehaze网络,通过结合对比损失和离散小波变换,增强图像特征表示,并利用多尺度特征提取捕捉高频细节,解决雾霾图像的颜色失真、对比度低和细节丢失问题。实验结果表明,该方法在去雾效果和鲁棒性上优于现有技术。
本研究提出了一种名为DENSER的新框架,用于动态城市环境场景重建中的动态物体建模。通过结合小波变换动态估计球谐基,DENSER能够更有效地表示动态物体的外观,并通过密集化点云提高物体形状表示的精确性,显著提升了动态场景重建的效果。实验证明,该方法在KITTI数据集上相较于现有技术有显著提高。
该研究提出使用神经网络辅助的额外lifting步骤来增强传统小波变换中的冗余性,提高降低分辨率后重建图像的视觉质量。应用于JPEG 2000图像编码标准中,能够在广泛的比特率范围内实现高达17.4%的平均BD比特率节省,同时保持JPEG 2000的质量和分辨率可扩展特性。
完成下面两步后,将自动完成登录并继续当前操作。