Fernweh ·

ML Zero to One | 03 机器学习入门实践

💡 原文中文，约16300字，阅读约需39分钟。

📝

内容提要

本文是《Python深度学习（第2版）》一书第三、四章的学习笔记，介绍了使用TensorFlow和Keras处理二分类、多分类和回归学习任务的方法。通过实践发现，先让训练出现过拟合现象，然后通过观察训练过程找到最佳的训练轮数，再次从头训练模型，可以得到最好的表现。

🎯

关键要点

本文是《Python深度学习（第2版）》一书第三、四章的学习笔记。
TensorFlow是基于Python的开源机器学习框架，Keras是构建于TensorFlow上的开源机器学习API库。
TensorFlow张量是不可赋值的常量，修改张量的值需要创建变量。
使用TensorFlow编写线性分类器的步骤包括生成数据、定义模型和训练步骤。
Keras的核心组件是层，层是数据处理模块，接收张量作为输入并输出张量。
Keras中构建模型有两种方法：作为Model类的子类和使用函数式API。
模型的损失函数、优化器和指标通过compile()方法进行配置。
fit()方法开始执行训练循环，接收训练数据、训练轮数和批量大小等参数。
验证数据用于监控模型在未见过的数据上的表现，避免过拟合。
使用IMDB数据集进行影评分类的二分类问题示例，模型使用二元交叉熵作为损失函数。
使用路透社数据集进行新闻分类的多分类问题示例，模型使用分类交叉熵作为损失函数。
房价预测是一个回归问题，使用波士顿房价数据集进行预测，模型使用均方误差作为损失函数。
K折交叉验证用于验证模型的稳定性，避免验证分数波动。
通过观察训练过程找到最佳的训练轮数，再次从头训练模型，可以得到最好的表现。

🏷️

标签

Keras Python深度学习 TensorFlow 二分类入门多分类机器学习

➡️

继续阅读

AI-DLC 在数据工程中的实践：从分层建模到数据质量的全流程协作
本文将介绍 AI-DLC（AI-Driven Development Life Cycle）——亚马逊云科技于 2025 年提出的一套开发方法论——在数据...
基于SGLang的大模型推理实践——从benchmark方法论到部署方案选型与调优
随着大语言模型（LLM）的快速发展，模型规模不断增大，对推理部署的要求也越来越高。在实际项目中，如何高效地在GPU集群上部署和优化大模型推理，已经成为AI...
WAIC 2026收官｜范式大会亮点集锦，见证AI 2.0从技术突破走向产业实践
Cornelia Biacsics: Building The OAPE PostgreSQL Certification
Building the OAPE PostgreSQL Certification I’m one of the founders of the...
什么是视频问诊?
你在医院小程序里看到过”视频问诊”入口，或者在新闻里读到某家互联网医院上线了视频问诊服务。你大概知道它是远程看病的，但真要你说清它和微信视频通话有什么区别、...
GitLab 19.2 Puts AI Agents to Work on the Security Backlog
GitLab has released version 19.2 of its DevSecOps platform, adding agentic au...