小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
MoE-PHDS:一个用于灵活运行时稀疏性的MoE检查点

本文介绍了MoE-PHDS(后hoc声明稀疏性),一种轻量级的SFT方法,允许在推理时灵活调整稀疏性,而无需更换模型或架构。PHDS通过在不同稀疏水平上训练,提高了模型的准确性和延迟可预测性,简化了MoE的部署,并提升了跨稀疏性的一致性。实验结果显示,PHDS在多个操作点上优于传统模型。

MoE-PHDS:一个用于灵活运行时稀疏性的MoE检查点

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-11T00:00:00Z
变换器模型中的混合专家架构

混合专家(MoE)架构在变换器模型中引入稀疏性,允许模型高效扩展而不增加计算成本。MoE通过多个专家模型处理输入,使用路由器选择合适的专家。每个变换器层都有独立的专家集,激活部分参数以提升性能。MoE的实现包括专家网络、路由机制和输出组合,能够在保持低计算资源的同时提升模型表现。

变换器模型中的混合专家架构

MachineLearningMastery.com
MachineLearningMastery.com · 2025-07-01T03:19:28Z

本研究探讨了生物信息指导的神经网络在生物医学中的应用,发现稀疏性比生物通路相关性更能提升模型性能。随机化模型在多个指标上表现与生物指导模型相当,甚至更优,提示生物通路注释可能过于嘈杂,建议采用标准化方法比较新旧模型。

Sparsity is All You Need: Rethinking Deep Learning Approaches Informed by Biological Pathways

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-07T00:00:00Z

本研究提出了一种新的异方差双贝叶斯弹性网(HDBEN)框架,旨在解决高维回归模型中误差方差不恒定的问题。HDBEN通过联合建模均值和对数方差,进行稀疏性和分组的回归系数及方差参数估计。理论分析和仿真结果表明,其在异方差和高维情境下优于现有方法,具有重要的应用价值。

Heteroscedastic Double Bayesian Elastic Net

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z
用户友好的系统可以帮助开发者构建更高效的仿真和人工智能模型

麻省理工学院研究人员开发的自动化系统SySTeC,通过利用数据冗余和稀疏性、对称性,优化深度学习算法,显著提高计算效率,速度提升近30倍,适用于多种应用,帮助非专家科学家提升AI算法性能。

用户友好的系统可以帮助开发者构建更高效的仿真和人工智能模型

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2025-02-03T05:00:00Z

本文探讨了扩散模型在生成高质量图像时速度慢的问题,提出了一种新方法,通过激进量化和显著稀疏性提升来加速生成过程并降低能耗。

SQ-DM: Accelerating Diffusion Models Using Aggressive Quantization and Temporal Sparsity

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-26T00:00:00Z

本研究提出了HashAttention,一种提高长上下文注意力计算效率的方法。HashAttention通过将关键token识别视为推荐问题,实现了$32 imes$的稀疏性,显著提升了模型推理速度,具有重要的实际应用潜力。

HashAttention: Semantic Sparsity for Faster Inference

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z

本文探讨了如何通过放宽Top-K精确要求来提高在高度并行的机器学习加速器上的并行性。研究表明,近似Top-K算法能有效提升稀疏性算法在语言模型中的性能。

Bucket-Based Approximate Top-K Algorithms for Enhanced Parallelism

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本研究提出了一种新技术,解决了深度神经网络在极端稀疏性下性能下降的问题,实现了99.90%至99.99%的稀疏性而不影响准确性,从而提升了网络性能,增强了模型在受限设备上的应用潜力。

Pushing the Limits of Sparsity: A Toolkit for Extreme Pruning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-20T00:00:00Z

本文综述了深度学习中稀疏性技术的研究进展,探讨了通过稀疏化优化神经网络以降低计算复杂度和存储需求。介绍了多种稀疏化方法及其在视觉变压器中的应用,强调了稀疏性对模型性能和计算效率的影响。

超越2:4:在GPU上高效变换器推理的V:N:M稀疏性探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

本文介绍了多种针对大型语言模型(LLMs)的剪枝方法,如LLM-Pruner、Wanda和GBLM-Pruner,强调在保持性能的同时实现模型压缩。这些方法在零样本分类和生成任务中表现优异,并提出了有效的剪枝策略和参数调整技巧,以提高模型的稀疏性和可解释性。

LLM-Rank:一种图论方法用于剪枝大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

清华大学和香港科技大学的研究提出了一种新的加速器设计,解决多模态Transformer模型在硬件执行时的稀疏性问题。通过优化调度器、令牌修剪器和自适应网络,提高了计算效率,减少了延迟。多模态模型在视觉问答和图像描述等领域有广泛应用,未来将进一步推动AI发展。

在多模态应用中使用的存储器计算技术——详细解析 ISSCC 2023 16.1 Multcim

DEV Community
DEV Community · 2024-10-16T07:12:43Z

本研究提出了一种新的切换稀疏自编码器架构,旨在降低训练计算成本。通过“小型专家”激活矢量路由方法,显著改善了特征重建与稀疏性,确保特征可解释性与传统架构相当。

Efficient Dictionary Learning and Switch Sparse Autoencoders

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

本研究提出了一种新颖的$(eta, eta)$-稀疏性概念,以提升群体分布鲁棒优化(GDRO)的模型有效性。通过创新算法,改善了抽样复杂度,使其对组数$K$的线性依赖转变为对较小的$eta$的线性依赖,从而显著提高了模型效率,并展示了一种自适应算法以适应最佳稀疏性条件。

Beyond Minimax Rates in Group Distributionally Robust Optimization: A Novel Notion of Sparsity

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-01T00:00:00Z

本文探讨了预训练神经网络的成功原因,强调稀疏性对预测性能的影响。研究提出了改进的激活函数和初始化方法,显著提升了图像分类的准确性,并首次在视觉识别挑战中超越人类表现。此外,研究还涉及深度神经网络的训练、优化算法及特征可视化的应用。

PReLU:又一个单层解决XOR问题的方案

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z

本研究探讨了稀疏性对深度神经网络设计的影响,表明粗粒度稀疏性在保持精度的同时提高了压缩率和设计效率。提出了掩码多样性度量、比特级稀疏量化法和N:M稀疏性训练等新方法,显示出在模型压缩和加速方面的潜力,尤其在FPGA硬件上表现优异。

双向比特级稀疏性用于深度学习加速

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-08T00:00:00Z

本文介绍了多种基于LiDAR的全景分割方法,如Panoster、EfficientLPS和Panoptic-PolarNet,旨在解决点云分割中的遮挡和稀疏性问题。这些方法通过创新架构和算法在多个数据集上实现了先进效果,推动了全景分割技术的发展。

DQFormer:面向统一的激光雷达全景分割与解耦查询

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-28T00:00:00Z

本文研究了大型语言模型的稀疏微调,提出了多种方法以提高模型的稀疏性和性能。通过引入稀疏权重和新激活函数,模型在推理和训练中实现了显著加速,尤其是在CPU和GPU上。研究表明,稀疏激活有效提升了模型效率,新方法如Q-Sparse和TDA在不影响性能的情况下,进一步优化了稀疏性和生成速度。

无训练的大型语言模型激活稀疏性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-26T00:00:00Z

本文介绍了多种基于稀疏性的深度学习加速方法,如SparseRT、N:M稀疏性训练和Channel-aware动态稀疏。这些方法在保持模型精度的同时,显著提升了计算速度和效率,适用于大型语言模型和现代硬件,解决了模型部署中的参数和内存问题。

混合稀疏训练:实现变压器预训练的4倍FLOP减少

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-21T00:00:00Z

本文探讨了卷积神经网络中的稀疏性技术,特别是在使用Batch Normalization和ReLU激活时的隐式稀疏性。研究表明,这种稀疏性可以通过特定功能的出现和修剪机制来实现,从而优化神经网络的结构和性能。此外,提出了Sparsity Normalization技术和掩码多样性度量方法,以降低内存占用并提高训练效率。

镜中的面具:隐式稀疏化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-19T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码