京东科技开发者 ·

AI入门之深度学习：基本概念篇

💡 原文中文，约7400字，阅读约需18分钟。

📝

内容提要

深度学习是机器学习的一个分支，通过多个表示层学习。神经网络是深度学习的模型，使用张量作为基本数据结构。神经网络的运算可以简化为张量运算，包括逐元素运算、张量积和张量变形。优化使用梯度下降法，反向传播是计算梯度的方法之一。使用Python的Keras库可以实现手写数字识别任务。

🎯

关键要点

深度学习是机器学习的一个分支，通过多个表示层学习。
神经网络是深度学习的模型，使用张量作为基本数据结构。
神经网络的运算可以简化为张量运算，包括逐元素运算、张量积和张量变形。
优化使用梯度下降法，反向传播是计算梯度的方法之一。
机器学习是利用反馈信号在输入数据中寻找有用的表示和规则。
深度学习强调从一系列连续的表示层中学习，通常包含数十个到上百个层。
神经网络的权重通过随机赋值和优化器微调来训练。
张量是机器学习的基本数据结构，包含轴、形状和数据类型三个关键属性。
逐元素运算、张量积和张量变形是神经网络中的基本张量运算。
深度学习可以将复杂的几何变换逐步分解为一系列基本变换。
梯度下降法是更新模型权重的有效方法，随机梯度下降是其一种实现。
反向传播算法利用链式法则计算复杂表达式的梯度。
使用Python的Keras库可以实现手写数字识别任务，MNIST数据集是经典示例。
模型训练过程包括加载数据、构建模型、编译模型、准备数据、拟合模型和评估模型。

❓

延伸问答

深度学习与机器学习有什么区别？

深度学习是机器学习的一个分支，强调通过多个连续的表示层进行学习，而机器学习通常被称为浅层学习。

神经网络是如何工作的？

神经网络通过随机赋值权重、计算预测值与真实值的损失、并利用优化器微调权重来学习。

什么是张量，它在深度学习中有什么作用？

张量是深度学习的基本数据结构，包含轴、形状和数据类型，主要用于表示和处理数据。

梯度下降法在深度学习中如何应用？

梯度下降法用于更新模型权重，通过计算损失函数的梯度，沿着梯度的反方向调整权重以降低损失值。

如何使用Keras库进行手写数字识别？

使用Keras库可以加载MNIST数据集，构建神经网络模型，编译模型，准备数据，拟合模型并进行预测。

反向传播算法的作用是什么？

反向传播算法用于计算复杂表达式的梯度，通过链式法则将损失值的反馈信号传递回网络，以更新权重。

🏷️

标签

ai 入门张量机器学习梯度下降法深度学习神经网络

➡️

继续阅读

从 ICML 2026 论文精选看 AI 工程化的下一步
ICML 2026 论文精选探讨了机器学习的关键挑战与实际影响，强调工程团队需关注研究与工程问题的转化。会议论文揭示未来技术栈的潜在问题，企业团队通过精选...
简单解释的10个机器学习概率概念
概率在机器学习中至关重要，影响模型的工作方式。随机变量、概率分布、期望和方差是基础概念。模型通过条件概率和贝叶斯定理更新预测，联合、边际和条件分布帮助理解...
新品发布 | 绿盟安全智算一体机，构建”算力、调度、安全”深度融合的AI基础设施
绿盟科技推出安全智算一体机，结合算力、调度与安全，提供高性能硬件和智能调度，确保AI应用的安全性与高效性。该产品实现一体化交付，提升算力利用率，降低成本，...
别让AI一上来就“进厂打螺丝”：智源悟界·Orca要先教模型理解世界如何变化
Orca团队的技术报告探讨了AI模型如何理解世界状态及其变化，旨在通过多模态学习构建统一的世界模型，结合无意识和有意识学习。实验结果显示，Orca在理解、...
[AI] curl -NT. 导致100% CPU原因
在使用curl连接持续推送数据的流服务器时，可能会出现100% CPU占用的问题。这是因为stdin未加入curl_multi_poll的pollset，...
阿里斩获国际AI顶会最佳资源论文奖，提出Agent评测新范式
阿里研究团队在ACL 2026会议上获得最佳资源论文奖，研究揭示了Agent在复杂规则推理中的缺陷，并提出了HSCodeComp基准。测试结果显示，现有A...