小红花·文摘

在3060显卡下，fp16推理的linear层在特定数据维度下提速约60%；layernorm在数据维度超过特定值时提速约40%；rmsnorm在triton版本下可实现30%以上的提速。提升效果与硬件和软件版本密切相关。

【Triton 教程】triton_language.abs

HyperAI超神经 ·

变换器模型中的LayerNorm和RMS Norm

MachineLearningMastery.com ·

本研究探讨了参数高效微调（PEFT）在医疗领域多模态模型中的应用，评估其对医学图像分析的影响。通过600多个实验，比较了16种PEFT方法，发现某些情况下性能提高达22%。研究还提出了神经元级微调（NeFT）和动态视觉提示调整方法（DVPT），在医学图像分析中显示出显著优势。

聚焦于效率：LayerNorm 作为细调医学视觉语言预训练模型的催化剂

BriefGPT - AI 论文速递 ·

改进和优化 BERT 预训练模型以实现参数高效微调，通过分析不同组件，发现经过微调后，输出层规范化（LayerNorm）发生的变化最为显著。通过仅微调 LayerNorm，可以达到与完全微调和其他参数高效微调方法相当甚至更好的性能，并用 Fisher 信息确定了 LayerNorm 的关键子集，在 GLUE 基准测试中解决了许多 NLP 任务。

LayerNorm: 参数高效微调中的关键组件

BriefGPT - AI 论文速递 ·

该文章介绍了用于微调和评估大型语言模型（LLMs）在专门货币化任务中的方法论，包括混合数据、设计评估框架和分析模型大小和持续训练对度量指标的影响。该框架旨在为企业和研究人员提供行动洞察，以使LLMs适应专门环境，并计划公开评估框架，以促进LLMs在专门任务上的透明度与合作。

调整 Attention 中的 LayerNorm：朝着高效的多模态 LLM 微调

BriefGPT - AI 论文速递 ·