ML Zero to One | 03 机器学习入门实践

💡 原文中文,约16300字,阅读约需39分钟。
📝

内容提要

本文是《Python深度学习(第2版)》一书第三、四章的学习笔记,介绍了使用TensorFlow和Keras处理二分类、多分类和回归学习任务的方法。通过实践发现,先让训练出现过拟合现象,然后通过观察训练过程找到最佳的训练轮数,再次从头训练模型,可以得到最好的表现。

🎯

关键要点

  • 本文是《Python深度学习(第2版)》一书第三、四章的学习笔记。
  • TensorFlow是基于Python的开源机器学习框架,Keras是构建于TensorFlow上的开源机器学习API库。
  • TensorFlow张量是不可赋值的常量,修改张量的值需要创建变量。
  • 使用TensorFlow编写线性分类器的步骤包括生成数据、定义模型和训练步骤。
  • Keras的核心组件是层,层是数据处理模块,接收张量作为输入并输出张量。
  • Keras中构建模型有两种方法:作为Model类的子类和使用函数式API。
  • 模型的损失函数、优化器和指标通过compile()方法进行配置。
  • fit()方法开始执行训练循环,接收训练数据、训练轮数和批量大小等参数。
  • 验证数据用于监控模型在未见过的数据上的表现,避免过拟合。
  • 使用IMDB数据集进行影评分类的二分类问题示例,模型使用二元交叉熵作为损失函数。
  • 使用路透社数据集进行新闻分类的多分类问题示例,模型使用分类交叉熵作为损失函数。
  • 房价预测是一个回归问题,使用波士顿房价数据集进行预测,模型使用均方误差作为损失函数。
  • K折交叉验证用于验证模型的稳定性,避免验证分数波动。
  • 通过观察训练过程找到最佳的训练轮数,再次从头训练模型,可以得到最好的表现。
➡️

继续阅读