小红花·文摘

点积是衡量向量对齐程度的重要运算，结合了长度和方向。在Transformer中，点积用于高效计算注意力。其代数和几何定义相辅相成，代数便于计算，几何提供直观理解。点积在高维空间有效，但需注意随机向量趋于正交的现象。与其他相似度度量相比，点积在工程应用中，尤其是在GPU并行计算时更具优势。

【Transformer 与注意力机制】02 向量与点积的几何直觉

土法炼钢兴趣小组的博客 ·

本文探讨了在Transformer模型中将点积结果除以√d_k的原因。这一操作旨在避免softmax函数饱和，确保梯度有效传播。通过数学推导，证明了点积的方差为d_k，缩放后方差归一化为1，从而保持训练的稳定性。文章还讨论了不同维度下的训练效果及现代优化器如何与√d_k的设计结合，以提升模型性能。

15｜Scaled Dot-Product：那个根号 d_k 是怎么来的

土法炼钢兴趣小组的博客 ·

本研究针对传统人工耳蜗编码策略在适应性和精确性上的局限，提出了一种基于深度学习的电极图生成模型，作为其先进替代方案。研究表明，该模型在重建音频信号的可懂度方面表现优越，STOI评分接近于传统ACE策略，展示了在个性化和高效性方面的潜在优势。

通过缩放点积注意力增强人工耳蜗信号编码

BriefGPT - AI 论文速递 ·

线性代数中的正交向量和正交单位向量

DEV Community ·

通过实验证明了一个简单的架构能够学习实现解决方案，使用定位机制或语义机制，同时研究了可训练的相同结构和低秩的非线性自注意层的学习情况，并在高维数据和大量训练样本的极限情况下提供了对于全局最小非凸经验损失函数的闭合描述，揭示了随着样本复杂度的增加，从定位机制到语义机制的出现性阶段转变，并通过与线性定位基准的比较证明了点乘注意层使用语义机制在具备足够数据的情况下的优越性。

基于可解模型的点积注意力中位置和语义学习之间的相变

BriefGPT - AI 论文速递 ·

通过点积和小型卷积神经网络，提出了一个通用框架用于快速可变形全局注册。该方法适用于临床环境，比基于局部图像块的指标快几个数量级。实验表明，该方法在未知的解剖学和模态组合上具有广泛的适应能力。

MAD：图像配准的模态无关距离度量

BriefGPT - AI 论文速递 ·

向量是由n个实数组成的一个n行1列（n1）或一个1行n列（1n）的有序数组；向量的点乘,也叫向量的内积、数量积，对两个向量执行点乘运算，就是对这两个向量对应位一一相乘之后求和的操作，点乘的结果是一个标量。代数定义于向量a和向量b： a和b的点积公式为：前提条件：要求一维向量a和向量b的行列数

向量的点积 - 蝈蝈俊

蝈蝈俊 ·