MachineLearningMastery.com ·

从提示到预测：理解LLM中的预填充、解码和KV缓存

💡 原文英文，约300词，阅读约需1分钟。

📝

内容提要

本文介绍了如何使用PyTorch实现选择器函数，生成条件张量，并计算不同注意力头的得分矩阵，最终得到上下文向量。

🎯

❓

选择器函数通过条件返回+1/-1的张量，并生成条件张量。

不同的注意力头选择不同的token，例如头1选择偶数位置的token，头2选择最后一个token。

通过将查询Q与选择器生成的K矩阵相乘，并进行缩放来计算得分矩阵。

因果掩码确保位置i只能关注于位置<=i，从而保持信息的因果性。

得分通过softmax函数转换为注意力权重，并处理完全掩码的行。

上下文向量通过将注意力权重与值V矩阵相乘得到。

🏷️

今天你用了多少词元？
Token（词元）是AI模型计算和计费的基本单位，不同模型的切分方式各异。我国日均词元调用量已超过140万亿次，未来有望实现“充词元”，迈入全民AI时代。
在NotebookLM上探索本杰明·富兰克林的科学发现
本文章介绍了由英国皇家学会与谷歌合作推出的“本杰明·富兰克林科学笔记本”。该笔记本利用AI技术，帮助用户探索富兰克林在电学理论和避雷针发明方面的科学贡献，...
亚马逊春季大促期间，首款支持Apple Home Key的UWB智能锁价格更低
U400锁可通过触摸键盘、指纹或钥匙解锁，支持Matter-over-Thread协议，需配合Thread边界路由器以节省电池。
Kelsey Hightower在KubeCon 2026： “在AI面前，每个人都是初级工程师”
随着Ingress NGINX的弃用，KubeCon讨论了鼓励公司关注依赖项目的策略，包括维护软件材料清单和支持项目维护者。有观点认为，AI降低了创作成本...
Beats健身友好的Powerbeats Fit在亚马逊春季大促销中优惠30美元
Powerbeats Fit在Beats Fit Pro和Powerbeats Pro 2之后发布，但仍存在问题，如使用旧款H1芯片而非H2芯片，充电盒较...
新的RCS更新可能在未来实现iPhone和Android视频通话的连接
MIVC将支持群组成员加入未及时参与的视频通话，并同步聊天记录，提供跨设备的原生视频通话体验。