陈少文的博客 ·

使用 PyTorch 在 MNIST 数据集训练模型

💡 原文中文，约8800字，阅读约需21分钟。

📝

内容提要

本文介绍了如何使用PyTorch构建和训练一个简单的卷积神经网络（CNN）以识别MNIST手写数字。首先定义超参数和数据加载，然后构建模型并实现训练和测试函数。训练过程中，模型损失逐渐降低，准确率提升。最后，通过测试脚本验证模型在真实数据上的表现，准确率达到80%。

🎯

关键要点

本文介绍了如何使用PyTorch构建和训练一个简单的卷积神经网络（CNN）以识别MNIST手写数字。
首先定义超参数和数据加载，然后构建模型并实现训练和测试函数。
训练过程中，模型损失逐渐降低，准确率提升。
通过测试脚本验证模型在真实数据上的表现，准确率达到80%。
创建训练脚本 minist.py，定义超参数、数据加载和模型结构。
使用Adam优化器和学习率衰减策略进行训练。
训练过程中输出训练损失和测试准确率。
创建测试脚本 test.py，定义与训练时相同的网络结构。
使用预处理函数处理输入图像，并进行预测。
启动测试任务，使用下载的手写数字图片进行模型测试。
计算模型的准确率，最终结果为80%。

❓

延伸问答

如何使用PyTorch训练MNIST数据集的模型？

首先创建训练脚本，定义超参数和数据加载，然后构建卷积神经网络模型，最后实现训练和测试函数。

在训练过程中，模型的损失和准确率是如何变化的？

训练过程中，模型损失逐渐降低，准确率逐步提升，最终测试准确率达到80%。

如何创建测试脚本来验证模型的表现？

创建测试脚本test.py，加载训练好的模型，预处理输入图像，并进行预测。

训练模型时使用了哪些优化器和学习率策略？

使用Adam优化器和学习率衰减策略进行训练。

如何处理输入图像以进行模型预测？

使用预处理函数将图像调整为28x28大小，并进行标准化处理。

模型的最终准确率是多少？

模型在测试中的最终准确率为80%。

🏷️

继续阅读

本地可跑的隐私检测模型：Privacy Filter 低成本实现高质量 PII 过滤；硬核开源！涵盖超 8 万场比赛的 Transfermarkt 结构化足球数据集
Privacy Filter 是 OpenAI 开源的双向标记分类模型，专门用于检测和屏蔽文本中的个人身份信息。该模型基于小型预训练架构，采用高效的片段解码方式。
OpenAI的新安全模型仅面向‘关键网络防御者’
OpenAI即将推出新的网络安全模型GPT-5.5-Cyber，首批仅向“可信的网络防御者”发布。CEO萨姆·阿尔特曼表示，此次有限发布旨在增强机构的网络...
2026 年 3 月和 4 月该入手的模型手办
2026年3月和4月的特别作品主要包括《光能使者》系列的光能使者和超级光能使者，以及记录孙悟空和库林修行的龟仙屋，但缺少布尔玛和朗琪，显得不太完整。
DeepSeek识图模式是个新模型？！一手实测在此（没错我被灰度到了）
DeepSeek的识图模式在灰度测试中表现优异，支持快速识别和推理。非思考模式下速度快但准确性需提升；思考模式下推理能力强但耗时较长。该模式有效处理OCR...
Zed 1.0协议风波：你的代码被用来做训练数据
Zed 1.0协议引发了开发者对数据使用权和隐私的担忧。模糊的条款导致用户误解，认为自己的代码可能被滥用。AI补全功能需要访问用户代码，可能导致数据外流。...
生数科技认领神秘登顶模型：AI视频公司拿出工业级Demo，跨本体跑通复杂长程任务
生数科技推出的MotuBrain是一款具身智能机器人通用大脑，具备世界模型的预测和行动能力，展现出卓越的物理理解和行动能力。MotuBrain通过统一建模...