小波压缩是一种图像压缩技术,通过小波变换在保持图像质量的同时减小文件大小,适用于医学成像和数码摄影等领域。尽管算法复杂且处理速度较慢,但其高效的存储和传输能力使其在各行业中越来越重要。
本研究提出了一种基于小波的双分支网络,旨在提高多视角糖尿病视网膜病变检测的效果。通过交叉视图融合模块,减少信息冗余,显著提升了对局部病变特征及其全局依赖关系的学习能力。实验结果表明,该方法在大规模公共数据集上表现优异。
本研究提出了一种新颖的零样本低光照增强方法,结合小波与傅里叶频域,有效解决了现有方法在复杂场景下的泛化能力问题,实验结果表明其具有良好的鲁棒性和有效性。
本研究提出局部隐式小波变换器(LIWT),旨在解决超分辨率方法在重建高频细节时未充分利用高频信息的问题。LIWT结合离散小波变换和小波增强残差模块,显著提升高频细节恢复效果,实验结果在多个基准数据集上表现优越。
本研究解决了胶囊内窥镜视频帧中肠胃异常自动分类的有效性问题。通过将全维度门控注意力机制与小波变换技术相结合,模型能够聚焦于内窥镜图像中最关键的区域,提高对微妙特征的检测能力。该模型在不平衡的数据集上取得了92.76%的训练精度和94.81%的平衡精度,显示出显著的分类准确性和临床应用潜力。
本研究解决了传统小波在纹理分割中效果不足的问题,提出使用新近引入的经验小波进行改进。通过引入卡通与纹理分解步骤,实验证明该方法在六个经典测试基准上优于传统小波,具有更好的纹理信息提取能力。
本文研究了用隐式神经表示(INRs)参数化图像的方法,强调小波作为激活函数的优势。小波在频率和空间上的本地化能力优于正弦函数。研究提出了通过MLP的第一层逼近高频特征的策略,并提供了INR架构设计建议,如使用复数小波和解耦低通与带通的方法。
本文针对卷积神经网络(CNN)的过拟合问题,提出了一种新颖的正则化方法——谱小波 dropout(SWD),通过在特征图的离散小波分解中随机丢弃详细频带,提高模型的泛化能力。与现有的傅里叶 dropout 方法相比,SWD 使用单一超参数,并在多个基准测试中表现出更低的计算复杂性与更优的性能。
本文研究了用隐式神经表示(INRs)参数化图像的方法,强调使用小波作为激活函数的优势。小波在频率和空间上的本地化能力优于正弦函数。研究提出了通过多层感知器(MLP)初步逼近信号高频特征的策略,并提供了INR架构设计建议,如使用复数小波和解耦低通与带通逼近。
WaveletGPT是将小波和大型语言模型结合起来,以改进信号处理任务。小波捕捉局部信号特征,语言模型学习复杂模式。WaveletGPT可以去噪音频信号,去除图像中的伪影,并设计无线通信系统。该模型由基于小波的特征提取器和大型语言模型组成。它优于传统方法和独立的语言模型。需要进一步研究来了解其局限性和探索潜在应用。
本文研究了利用INRs和MLP对图像进行参数化的方法,展示了使用正弦激活函数和小波激活函数的优势。研究探讨了INRs如何从MLP的第一层进行粗糙逼近以解析信号的高频特征。提出了多种INR架构设计,包括复数小波、解耦低通和带通逼近以及基于信号奇点的初始化方案。
以小波变换为基础,我们提出了 Wave-Mamba 方法来解决 UHD 图像低光增强问题,通过低频状态空间块和高频增强块的相互作用,有效地提高了低光增强效果。
最近的研究发现,小卷积核和卷积操作可以实现与大卷积核相近的效果。通过稀疏机制,位移式操作符能够在保持硬件友好性的同时捕捉长距离依赖关系。实验证明,位移式 CNN 模型在准确性和计算要求方面都有显著提高。
基于小波图像编码和语言变换器的自回归图像生成方法。
本文介绍了一种使用Kolmogorov-Arnold网络预测柔性电流体力泵压力和流量的新方法。该方法通过可学习的基于样条的激活函数代替固定的激活函数,更有效地逼近复杂的非线性函数。实验结果表明,该方法具有高的预测准确性和可解释性,是电流体力泵预测建模的有希望的替代方法。
本文提出了一种将U-Net架构与DenseNet-121主干相结合的分割方法,利用两者的优势捕捉全面的上下文和空间信息。实验结果显示该模型在组织病理学图像分析和癌症诊断方面具有潜力。
该研究介绍了RetinexMamba架构,结合了传统Retinex方法和深度学习框架,通过引入SSMs提高了处理速度,并使用Fused-Attention机制替换了IG-MSA,提高了模型的解释能力。实验评估表明,RetinexMamba在增强低光图像方面优于现有方法。
本文提出了一种基于小波和神经网络的多级小波分解网络(mWDN),用于构建能感知时间序列频率的深度学习模型,并提出了两个深度学习模型以应用于时间序列分类和预测,并在多个数据集上进行了实验验证。同时还提出了一种解释深度学习的方法。
本文介绍了一种基于转换器的W.A.L.T方法,用于逼真视频生成。通过因果编码器在统一的潜在空间中联合压缩图像和视频,并使用窗口注意力架构进行联合空间和时空生成建模,实现了最先进的性能。同时,还训练了三个模型的串联,用于文本到视频生成任务。
本文提出了一种基于Transformer和小波的网络(WaveletFormerNet)用于雾图像恢复,通过嵌入离散小波变换到Vision Transformer中,缓解了降采样导致的图像质量损失和颜色失真,同时引入了并行卷积和特征聚合模块以提高模型性能和泛化能力。实验结果表明,WaveletFormerNet在雾图像恢复和计算机视觉应用中表现出更好的效果。
完成下面两步后,将自动完成登录并继续当前操作。