ML Zero to One | 03 机器学习入门实践
💡
原文中文,约16300字,阅读约需39分钟。
📝
内容提要
本文是《Python深度学习(第2版)》一书第三、四章的学习笔记,介绍了使用TensorFlow和Keras处理二分类、多分类和回归学习任务的方法。通过实践发现,先让训练出现过拟合现象,然后通过观察训练过程找到最佳的训练轮数,再次从头训练模型,可以得到最好的表现。
🎯
关键要点
- 本文是《Python深度学习(第2版)》一书第三、四章的学习笔记。
- TensorFlow是基于Python的开源机器学习框架,Keras是构建于TensorFlow上的开源机器学习API库。
- TensorFlow张量是不可赋值的常量,修改张量的值需要创建变量。
- 使用TensorFlow编写线性分类器的步骤包括生成数据、定义模型和训练步骤。
- Keras的核心组件是层,层是数据处理模块,接收张量作为输入并输出张量。
- Keras中构建模型有两种方法:作为Model类的子类和使用函数式API。
- 模型的损失函数、优化器和指标通过compile()方法进行配置。
- fit()方法开始执行训练循环,接收训练数据、训练轮数和批量大小等参数。
- 验证数据用于监控模型在未见过的数据上的表现,避免过拟合。
- 使用IMDB数据集进行影评分类的二分类问题示例,模型使用二元交叉熵作为损失函数。
- 使用路透社数据集进行新闻分类的多分类问题示例,模型使用分类交叉熵作为损失函数。
- 房价预测是一个回归问题,使用波士顿房价数据集进行预测,模型使用均方误差作为损失函数。
- K折交叉验证用于验证模型的稳定性,避免验证分数波动。
- 通过观察训练过程找到最佳的训练轮数,再次从头训练模型,可以得到最好的表现。
🏷️
标签
➡️