小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出UMoE架构,解决了Transformer模型中注意力层与前馈网络性能差异的问题,提高了参数共享效率和整体性能。

UMoE: Unified Attention Mechanism and Feedforward Network through Shared Experts

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-12T00:00:00Z

变压器架构在人工智能任务中广泛应用,尤其是大型语言模型。注意力层是性能瓶颈,需优化。分析显示,预填充阶段计算密集,解码阶段则内存密集。优化注意力层可提升性能,减少内存访问是关键。

变压器基础注意力性能理论分析

Lei Mao's Log Book
Lei Mao's Log Book · 2025-01-27T08:00:00Z

本研究探讨了权重衰减和L2正则化对深度神经网络训练的影响,尤其是在注意力层中。结果显示,权重衰减显著降低参数矩阵的秩,可能导致语言模型性能下降。

权重衰减诱导低秩注意力层

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

该研究提出了一种新型Transformer模型,通过注意力层和可学习的记忆令牌显著提升了模型在新任务上的适应性和性能。引入反馈循环和优化内存操作后,模型在处理长文本任务时表现优异,展现了处理无限长序列的潜力。同时,研究探讨了模型大小与性能之间的关系,并提出了基于Hopfield网络的理论框架,揭示了Transformer的记忆过程。

演化通用变压器记忆

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

本文探讨了Transformer网络在算法任务中的应用,分析了其在处理全局与上下文信息时的表现。研究发现,Transformer模型能够有效学习组合结构,并在特定任务上展现良好的推广能力。实验验证了模型注意力层对组合性的关键作用,并提出了改进模型解释性的方法。此外,研究还探讨了随机化算法在对抗性环境中的应用,显示出提升模型表现的潜力。

随机变换器的算法能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-06T00:00:00Z

本研究介绍了NOVA,一种基于NoC的向量单元,可在加速器的NoC中执行非线性操作,并能覆盖现有的神经加速器,以在边缘计算中映射注意力层。NOVA体系结构比最先进的硬件逼近器高效节能,可提高功率效率高达37.8倍。

NOVA: 基于片上网络的向量单元,用于在 CNN 加速器上映射注意力层

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-07T00:00:00Z

本文研究小规模下训练稳定性和不稳定性的再现和研究方法,探讨了注意力层中逻辑增长和输出逻辑概率分歧的两个训练不稳定性来源,以及学习率、优化器和模型干预对最终损失的影响。通过研究模型激活和梯度范数的缩放行为来预测出现不稳定性的两种情况。

大规模 Transformer 训练不稳定性的小规模代理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-25T00:00:00Z

本文提出了三种易于实现的视觉Transformer变体,包括并行处理残差层、微调注意力层权重以适应更高分辨率和其他分类任务、添加基于MLP的补丁预处理层以提高自监督训练效果。作者使用ImageNet-1k数据集评估了这些设计选择的影响,并在ImageNet-v2测试集上确认了研究发现。同时,在六个较小的数据集上评估了转移性能。

计算机围棋的视觉转换器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-22T00:00:00Z

该研究分析了变形器模型的表示能力和内在复杂度参数,证明了其相对于循环网络和前馈网络的优势,且复杂性仅随着输入规模的对数增长。同时,该研究提出了一个三元组检测任务,其中注意力层的复杂性随输入规模线性增长,但可以通过注意力层的自然变种有效地解决。该研究强调了通信复杂度在变形器及其相关模型的分析中的价值。

仅关注注意力的 Transformer 模型及使用注意力头实现的 MLP

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码