学习让我快乐 ·

从 transformer 到 FlashAttention 再到 PagedAttention(1)

📝

内容提要

整理笔记时发现这篇之前学习 transformer 的总结, 略加梳理之后发表出来, 希望能帮到你=. = 本文假设你已经有这里提到的数学常识. 先看 transformer, 先理清 encoder 一个层输入/输出, 如下图所示, P.S. 我发现动动手把输入/输出 shape 写出来很是有助于加深理解呀.: encoder 部分最低层的输入很明显是用户输入, 此时 $n_i$...

🏷️

继续阅读

Git 2.54 版本亮点
在人工智能时代，开源项目的维护者需要重新思考指导策略。3Cs框架帮助维护者更有效地进行指导，避免疲惫。GitHub正在投资开源安全，支持维护者并与Alph...
Birdfy的新款4K鸟食器希望教你识别它所识别的鸟类
Birdfy推出了新款4K鸟食器Metal 2，配备升级的广角摄像头，能够识别6000多种鸟类，并提供定制信息。食器容量为1.8升，售价269.99美元，...
卡普空出手整顿成人MOD，“上了PC穿什么”也由不得玩家了
玩家群体间流传一句话，叫作“上了PC穿什么就由不得你了”。意指一旦游戏登陆了开放的PC环境，玩家就可以通过MOD自由修改、调整游戏内容，到时候角色怎么穿、...
【独家专访】当下育碧还剩下的杀手锏，可能是这套“黑科技”自研引擎
也证明了“画质”“优化”可以兼得。当下游戏里的天气系统能做到多“真实”？当一阵风从海面上吹来，带动起轻微的浪花。岸边的树木枝叶颤动，原本轻轻飘落的小雨和樱...
一家河南的农药公司，怎么吃上了“生化危机”的流量
没有阴谋，都是阳谋六夫丁是一家农药公司，而在过去一个月里，它很可能已经成为了国内最知名的农药公司之一。起初，大家只是发现六夫丁的公司商标和《生化危机》系列...
人形机器人‘闪电’打破半程马拉松纪录
名为“闪电”的自主机器人在北京半程马拉松中以50分26秒的成绩完成比赛，打破了人类和机器人记录。该机器人由荣耀公司开发，模仿精英跑者，采用液冷技术，击败了...

从 transformer 到 FlashAttention 再到 PagedAttention(1)

内容提要

标签

继续阅读