科学空间|Scientific Spaces ·

n个正态随机数的最大值的渐近估计

💡 原文中文，约7400字，阅读约需18分钟。

📝

内容提要

本文研究了$n$个独立标准正态分布随机数的最大值$z_{ ext{max}}$的数学期望$ ext{E}[z_{ ext{max}}]$，结果显示随着$n$的增加，$ ext{E}[z_{ ext{max}}]$近似为$ ext{sqrt{2log n}}$，并提供了三种证明方法。同时，文章分析了低精度Attention中重复最大值的概率。

🎯

关键要点

研究$n$个独立标准正态分布随机数的最大值$z_{ ext{max}}$的数学期望$E[z_{ ext{max}}]$。
随着$n$的增加，$E[z_{ ext{max}}]$近似为$ ext{sqrt{2log n}}$。
提供了三种证明方法来支持这一结论。
第一个证明利用了$ ext{exp}$的凸性，得出$E[z_{ ext{max}}] ext{的上界为} ext{sqrt{2log n}}$。
第二个证明通过求$z_{ ext{max}}$的概率密度函数，得出累积分布函数为$[ ext{Phi}(z)]^n$。
第三个证明基于逆累积分布函数的采样思路，得出$E[z_{ ext{max}}] ext{近似为} ext{Phi^{-1}(rac{n}{n+1})}$。
分析了低精度Attention中重复最大值的概率，得出在BF16格式下出现重复最大值的概率。
通过数值模拟与理论结果进行对比，验证了重复最大值的概率估计。

❓

延伸问答

如何估计n个正态随机数的最大值的数学期望？

n个独立标准正态分布随机数的最大值的数学期望近似为√(2log n)。

随着n的增加，最大值的期望值有什么变化？

随着n的增加，最大值的期望值E[z_max]近似为√(2log n)，并且这个结果越来越准确。

文章中提到的三种证明方法是什么？

第一种证明利用了exp的凸性，第二种通过概率密度函数，第三种基于逆累积分布函数的采样思路。

如何通过概率密度函数计算最大值的期望？

通过求最大值的概率密度函数p_max(z)，然后积分计算期望E[z_max] = ∫ z * p_max(z) dz。

低精度Attention中重复最大值的概率如何估计？

通过最大值的近似和BF16格式的精度，估计出现重复最大值的概率为1 - e^(-u/128)。

如何验证理论结果与数值模拟的对比？

通过数值模拟计算重复最大值的概率，并与理论结果进行比较，验证其准确性。

🏷️

继续阅读

我是怎么让 Claude 和 Codex 帮忙完成课程作业
本文讲述了作者如何利用AI工具Claude和Codex完成运营与供应链管理课程的作业。通过对比两者的解答，发现Claude存在三处方法论错误，导致结论相反...
从 OpenSwiftUI 到 DanceUI：换个方式 Dive SwiftUI - 肘子的 Swift 周报 #132
自2019年发布以来，SwiftUI逐渐成为苹果开发者的重要工具，但其闭源特性使得开发者难以深入理解。为此，社区希望通过开源项目复刻SwiftUI。最近，...
Bridging Data Science and Marketing: Adobe and Databricks Launch Delta Sharing for Adobe Experience Platform and Agentic Marketing Workflows
In today’s hyper-competitive landscape, "speed to insight" is no long...
Take Control: Customer-Managed Keys for Lakebase Postgres
Encryption at rest is a cloud baseline, but for enterprises operating in high...
Deploying Cross-Site Replication in Percona Operator for MySQL (PXC)
Having a separate DR cluster for production databases is a modern day require...
大规模自主AI：Adobe代理与NVIDIA和WPP解锁突破性的创意智能
AI agents are transforming how work gets done across all industries, accelera...