小红花·文摘

本研究比较了变换器模型在时间序列预测中的修剪方法，探讨了高参数量和计算资源需求的问题。分析表明，某些模型在高稀疏度下仍能超越密集模型，但需对修剪后的模型进行调整以优化性能。

A Comparative Study of Pruning Methods for Transformer-based Time Series Forecasting

BriefGPT - AI 论文速递 ·

研究探讨了动态稀疏训练（DST）在连续学习中的影响。结果显示，低稀疏度下Erdos-Renyi Kernel（ERK）初始化更有效，高稀疏度下均匀初始化更稳健。增长策略的效果取决于初始化和稀疏度。DST的适应性可能提升连续学习效果。

频域中的持续学习

BriefGPT - AI 论文速递 ·

本研究发现，在连续学习中，低稀疏度下使用ERK初始化能更有效地利用主干网络，高稀疏度下使用均匀初始化更可靠。增长策略的性能取决于初始化策略和稀疏度程度。适应性是提升连续学习效果的有希望的方法。

稀疏增长：解决任务无关的持续学习中的增长诱导遗忘问题

BriefGPT - AI 论文速递 ·

稳定并行连续学习的训练方法

BriefGPT - AI 论文速递 ·

本研究提出了一种基于可解释的attention机制的网络修剪方法，能在保持准确率的前提下实现模型压缩和加速。实验证明，在Cifar-100数据集上取得了最高的稀疏度和加速比，与最佳方法相比准确率相当；在MNIST和LeNet架构上也取得了最高的稀疏度和加速比。

基于基底投影层的稀疏数据在深度学习训练中的设计 —— 以 GC-MS 光谱为案例研究

BriefGPT - AI 论文速递 ·

本研究发现，在连续学习中，使用ERK初始化在低稀疏度下更有效利用主干网络，而在高稀疏度下使用均匀初始化更可靠。增长策略的性能取决于初始化策略和稀疏度程度。适应性是提升连续学习效果的有希望的方法。

DynST: 资源受限时空预测的动态稀疏训练

BriefGPT - AI 论文速递 ·

本研究发现，在连续学习中，使用ERK初始化在低稀疏度下更有效，而使用均匀初始化在高稀疏度下更可靠。增长策略的性能取决于初始化策略和稀疏度程度。适应性是提升连续学习效果的有希望的方法。

动态稀疏学习：一种高效推荐的新范式

BriefGPT - AI 论文速递 ·

本研究实证研究了Dynamic Sparse Training (DST)在连续学习中的影响。发现低稀疏度下使用Erdos-Renyi Kernel (ERK)初始化能更有效利用主干网络，高稀疏度下使用均匀初始化更可靠。增长策略的性能取决于初始化策略和稀疏度程度。适应性是提升连续学习效果的有希望的方法。

EsaCL：高效学习稀疏模型

BriefGPT - AI 论文速递 ·

该文介绍了一种稀疏的现代 Hopfield 模型，实现了稀疏注意机制和记忆检索动态，并提供了稀疏度相关的记忆检索误差界。实验结果表明，稀疏 Hopfield 模型在许多情况下优于其密集对应物。

稀疏现代 Hopfield 模型

BriefGPT - AI 论文速递 ·

本研究探讨了 Dynamic Sparse Training (DST) 在连续学习中的影响，发现在低稀疏度下，ERK 初始化更有效，而在高稀疏度下，均匀初始化更可靠。适应性是提升连续学习效果的有希望的方法。

SALSA-CLRS：一种稀疏且可扩展的算法推理基准

BriefGPT - AI 论文速递 ·

GEN-CNP是一种能够从目标模型的特征图中学习预测神经通路的模型，遵循同类神经通路主要由与类别相关的神经元组成和每个实例的神经通路稀疏度应得到最佳确定的可解释性准则。实验证明该模型具有忠实性和可解释性。

关于可迁移的神经通路的模型解释

BriefGPT - AI 论文速递 ·

本研究提出了一种基于可解释的attention mechanism的网络修剪方法，能在保持准确率的前提下实现模型压缩和加速，适用于各种深度神经网络。实验证明，在Cifar-100数据集上取得了最高的稀疏度和加速比，与最佳方法相比准确率相当；在MNIST和LeNet架构上也取得了最高的稀疏度和加速比。

少即多 —— 利用结构稀疏性构建简约的多任务模型

BriefGPT - AI 论文速递 ·