贝叶斯方法发挥作用案例 - 联邦党人文集作者公案 - 蝈蝈俊
💡
原文中文,约2000字,阅读约需5分钟。
📝
内容提要
1787年5月,美国宪法草案发表后,Mosteller和Wallance用统计学的方法,鉴定出《联邦党人文集》的作者身份,他们采用贝叶斯公式为核心的分类算法,从写作风格的细微差别来分辨,研究结果引起轰动,打破了200年来统计学界的禁锢。
🎯
关键要点
- 1787年5月,美国宪法草案发表后,反对派以“反联邦主义者”为笔名发表批评文章。
- 亚历山大·汉密尔顿与约翰·杰伊、麦迪逊以普布利乌斯的笔名发表文章,解释宪法的重要性。
- 《联邦党人文集》包含85篇文章,汉密尔顿坚持匿名发表,作者身份成谜。
- 1810年,汉密尔顿列出《联邦党人文集》的作者名单,1818年麦迪逊提出另一份名单,两者不一致。
- 1955年,Mosteller与Wallance利用统计学方法鉴定《联邦党人文集》的作者身份。
- 汉密尔顿和麦迪逊的写作风格非常接近,导致作者身份难以分辨。
- Mosteller和Wallance采用贝叶斯公式的分类算法,通过词汇频率分析来判断作者。
- 他们在没有计算机的条件下手工处理数据,耗时耗力,近100名学生参与数据处理。
- 研究发现汉密尔顿和麦迪逊在特定词汇使用上的差异,最终得出12篇文章的作者可能是麦迪逊。
- 1964年,Mosteller和Wallance的研究成果引起轰动,贝叶斯公式开始广泛使用。
➡️