The Combinatorial Theory of Dropout: Subnetworks, Graph Geometry, and Generalization
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本文探讨了辍学机制在深度学习中的作用,提出将训练视为在高维图中对二进制子网络的随机游走。研究表明,良好泛化的子网络形成低阻抗簇,且数量随网络宽度指数增加,强调了辍学在采样中的重要性。
🎯
关键要点
- 本文探讨了辍学机制在深度学习中的作用。
- 提出将训练视为在高维图中对二进制子网络的随机游走。
- 研究表明,良好泛化的子网络形成低阻抗簇。
- 低阻抗簇的数量随网络宽度指数增加。
- 强调了辍学在采样中的重要性。
➡️