小红花·文摘

本文讨论了将单次点积扩展为批量点积的矩阵乘法，强调其在Transformer中的重要性。矩阵乘法通过并行计算显著提高了效率，尤其在GPU上。文章介绍了矩阵的基本定义、转置、乘法性质及其几何意义，强调了形状匹配的重要性，并指出矩阵乘法在深度学习中的广泛应用，如注意力机制和全连接层，揭示了其在AI计算中的核心地位。

【Transformer 与注意力机制】03 矩阵乘法的两种视角

土法炼钢兴趣小组的博客 ·

模块化：GPU内核的软件流水线：第一部分 - 流水线问题

Modular Blog ·

AlphaEvolve：AI 打破 56 年数学纪录，发现更快的矩阵乘法算法

Micropaper ·

Lambda-revenge是XCTF 2022的一道高难度逆向题，基于Lambda演算实现复杂的矩阵乘法验证。通过分析源代码和Church编码，提取矩阵及结果，建立线性方程组求解，最终得到flag：XCTF{M4tRI1|i||l|Il|I1X_A5_YC0mb}。

Lambda-revenge CTF逆向题目完整技术解析

FreeBuf网络安全行业门户 ·

如果今天这篇注意力机制的帖子看不懂的话，就...可以重读大一了

dotNET跨平台 ·

模块化：在Blackwell上的矩阵乘法：第4部分 - 打破SOTA

Modular Blog ·

7个加速数值计算的NumPy技巧

MachineLearningMastery.com ·

模块化：Blackwell上的矩阵乘法：第三部分 - 达到85%最先进性能的优化

Modular Blog ·

模块化：Blackwell上的矩阵乘法：第二部分 - 利用硬件特性优化矩阵乘法

Modular Blog ·

模块化：在Nvidia Blackwell上的矩阵乘法：第一部分 - 介绍

Modular Blog ·

演讲：利用现代架构最大化CPU上的深度学习性能

InfoQ ·

香港中文大学提出的新算法RXTX，通过结合机器学习与组合优化，优化矩阵乘法，节省5%-10%的能源和时间，尤其在大规模矩阵运算中表现优越。

矩阵乘法可以算得更快了！港中文10页论文证明：能源、时间均可节省

量子位 ·

谷歌的AlphaEvolve打破了56年来的矩阵乘法效率记录，改进了Strassen算法，将4×4矩阵乘法的标量乘法次数从49次减少到48次。这项技术不仅能解决复杂数学问题，还能提升AI训练和芯片设计的效率。研究人员通过进化算法让AI自主探索，发现更优解，展现出自我优化的潜力。

打破56年数学铁律！谷歌AlphaEvolve自我进化实现算法效率狂飙

量子位 ·

认识AlphaEvolve，谷歌的人工智能，它能够自我编写代码，并且刚刚节省了数百万的计算成本

DEV Community ·

谷歌DeepMind与陶哲轩等科学家合作推出AlphaEvolve，提升了矩阵乘法、芯片设计和AI训练的效率，并能解决300年前的几何难题，展现出广泛的应用潜力。

陶哲轩DeepMind梦幻联动，最强通用科学Agent来了！一口气解决芯片设计、矩阵乘法和300年几何难题

量子位 ·

Google DeepMind推出AlphaEvolve，提升矩阵乘法效率；上海定制巴士系统优化公交服务；学习Rust需掌握核心概念；Nextcloud因Google限制失去文件上传功能；山区用户在使用SMS 2FA时面临困难，需要替代方案。

2025 05 15 HackerNews

介绍 on SuperTechFans ·

AlphaEvolve是一个基于大型语言模型的进化编码代理，旨在发现和优化算法。它通过创意和自动评估提升谷歌数据中心的效率，设计了更快的矩阵乘法算法，并在数学和计算领域取得显著进展。AlphaEvolve能够处理复杂问题，推动算法发现，未来有望在多个领域带来变革。

AlphaEvolve：一个基于Gemini的编码代理，用于设计先进算法

Google DeepMind Blog ·

AlphaEvolve是一个基于大型语言模型的进化编码代理，旨在发现和优化算法。它结合了创意问题解决能力和自动评估器，提升了谷歌的数据中心效率、芯片设计和AI训练。AlphaEvolve在数学和计算领域取得了显著进展，包括发现更快的矩阵乘法算法，并在多个开放数学问题上取得突破，展现出广泛的应用潜力。

AlphaEvolve：一个基于Gemini的编码代理，用于设计先进算法

Google DeepMind Blog ·

在Triton中实现矩阵乘法及L2缓存优化

Nathan Chen ·

第一个 CUDA 程序之矩阵运算计算效能对比

Frytea's Blog ·