💡
原文中文,约1900字,阅读约需5分钟。
📝
内容提要
朴素贝叶斯分类器是一种概率框架下的统计学习分类器,通过条件概率估计类先验概率和类条件概率。它采用属性条件独立性假设,简化了类条件概率计算。模型的训练是参数估计,可以事先储存概率值以便快速计算。数据预处理中的向量化和矩阵化操作是追求简洁高效的机器学习方法。
🎯
关键要点
- 朴素贝叶斯分类器是一种基于条件概率的统计学习分类器。
- 贝叶斯法则的核心是条件概率,涉及类先验概率和类条件概率的估计。
- 先验概率是基于以往经验的概率,后验概率是基于新信息修正后的概率。
- 极大似然估计(MLE)是一种经典的概率分布估计方法,依赖于训练样本。
- 朴素贝叶斯分类器采用属性条件独立性假设,简化了类条件概率的计算。
- 拉普拉斯修正是一种经典的平滑处理方法,用于避免属性值为0的问题。
- 词集模型和词袋模型是文本处理中的两种不同统计方法。
- 数据预处理中的向量化和矩阵化操作追求简洁和高效。
➡️