本研究提出了一种新方法,通过频域分析和低频压缩,解决大型语言模型在长文本生成中的上下文窗口扩展问题,显著提高微调和推理效率。
本研究解决了现有数据驱动算法未考虑智能电表数据质量的问题,缺乏异常检测机制,无法有效区分异常数据的特征。文章提出了一种基于Isolation Forest算法和快速傅里叶变换过滤的异常检测框架,能够在时域和频域内有效识别和减轻异常数据对电力消耗数据的影响。这一方法的引入对于高比例智能电表的配电网络分析具有重要意义。
本文提出了一种新方法FreDF,通过频域标签训练解决时间序列预测中的标签自相关性问题,显著提升预测精度,适用于多种主流模型。实验结果表明,FreDF在多个数据集上表现优异,验证了其有效性和通用性。
本研究提出FreqBack方法,针对深度神经网络时间序列分类模型的后门攻击,通过频域分析生成触发器,成功率超过90%,对模型准确率的影响小于3%。
清华大学研究团队提出了轻量级语音分离模型TIGER,结合时频交叉建模和频带切分策略,显著提升了语音分离效果。新数据集EchoSet更真实地模拟了复杂声学环境,实验结果表明TIGER在性能和效率上优于现有模型。
AIxiv专栏促进了学术交流,报道了2000多篇文章。研究者探讨了图神经网络(GNN)的统一框架,连接空域与频域,推动图学习理论的发展,并为未来的研究方向提供了新的探索空间。
该研究提出了一种新方法F-SE-LSTM,结合频域分析与滑动窗口技术,解决时间序列异常检测中的隐秘异常识别问题,实验结果表明其优于现有深度学习方法。
本研究解决了动量系数选择不明确的问题,这限制了对动量在随机梯度方法中作用的理解。通过将动量法解释为梯度的时变滤波器,提出了一种频域分析框架,从而形成了动态调整滤波特性的启发式优化器FSGDM,显著提高了模型的泛化性能。
本研究提出了一种新颖的零样本低光照增强方法,结合小波与傅里叶频域,有效解决了现有方法在复杂场景下的泛化能力问题,实验结果表明其具有良好的鲁棒性和有效性。
本研究提出双重对抗训练方法,通过优化对抗幅度生成器,提高深度神经网络的鲁棒性,同时保留关键模式。实验表明,该方法显著增强了模型对多种对抗攻击的抵抗力,具有重要实用价值。
研究探讨了动态稀疏训练(DST)在连续学习中的影响。结果显示,低稀疏度下Erdos-Renyi Kernel(ERK)初始化更有效,高稀疏度下均匀初始化更稳健。增长策略的效果取决于初始化和稀疏度。DST的适应性可能提升连续学习效果。
本研究解决了现有深度学习方法在结肠镜图像中准确分割结直肠息肉时面临的RGB信息有限和多尺度聚合特征对齐问题。提出的PSTNet通过集成RGB和频域信息,通过频率表征注意模块、特征补充对齐模块和交叉感知定位模块,实现了更加有效的息肉分割,在多个数据集上表现出显著的精确度提升,推动了计算机辅助息肉分割的发展。
该论文介绍了对Wilkie、Stonham和Aleksander的Recognition Device (WiSARD)和Weightless Neural Networks (WNNs)进行训练和推理的同态评估方法。WNN在性能上表现更好,准确性下降相对较小。他们开发了一个完整的框架,在经过加密训练后的MNIST数据集上获得91.7%的准确率,并在3.5小时内提升至93.8%。对于HAM10000数据集,经过1.5分钟的加密训练,准确率为67.9%,在1小时后提升至69.9%。该框架的速度提升了最多1200倍,准确率下降最多为5.4%。对于HAM10000数据集,准确率提升0.65%,速度比Glyph快60倍。同时,他们还提供了小规模加密训练的解决方案。
通过频域解释网络组件,发现生成模型频率分布与网格状模式不一致。开发了低成本的合成模型,能生成模拟真实生成模型中的频率模式图像。指纹提取器在合成数据上预训练后,展现出优越的迁移能力。
本研究提出了一种新的高效模型变体EfficientVMamba,通过探索视觉状态空间模型在轻量级模型设计中的潜力。实验结果显示EfficientVMamba在各种视觉任务中取得了有竞争力的结果。
该研究提出了一种新的基于频域引导的多尺度扩散模型(FDDiff),通过细化的步骤将高频信息的补充过程分解为更精细的步骤,以逐步补充缺失的高频细节,并利用多尺度频率细化网络在一个统一的网络中预测所需的多尺度高频成分,通过对流模型在图像超分辨率任务中生成高质量图像,并在广泛的评估中展示了其优于先前的生成方法的结果。
CNN 模型易受到对抗攻击的脆弱性为安全关键应用的部署带来了担忧,本研究通过在频域中构建空间频率图层来探讨 CNN 模型的脆弱性,通过广泛的实验观察到空间频率 CNN 模型在白盒和黑盒攻击下比常规 CNN 模型更加稳健,此外,发现低频成分对空间频率 CNN 模型的鲁棒性有重大贡献,这些发现将有助于未来设计更加鲁棒的 CNN 模型。
本文提出了一种利用系统辨识方法设计Kalman滤波器的两步法,研究发现等价Kalman滤波器在参数精确度较高或具有足够鲁棒性时具有次优保证。同时,提出了一种用样本复杂度度量最小观测数据数的方法。
多视角祖先采样(MAS)是一种用于生成一致的多视角2D样本的方法,可以创建对应的3D物体。MAS利用2D数据训练的扩散模型,为3D数据稀缺的运动领域提供机会。MAS通过去噪不同角度下的多个2D运动序列,保证了每个扩散步骤中所有视角的一致性,并将生成结果合并为统一的3D序列。MAS在职业篮球动作、韵律体操和马障碍赛等视频中展示了效果。相比流行的基于优化的去噪方法,MAS提供了更自然的一体化,避免了常见问题。
完成下面两步后,将自动完成登录并继续当前操作。