小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

神经网络通过前向传播、损失计算、反向传播和梯度下降进行训练。每个神经元执行线性打分和非线性激活,多个神经元组成层,层与层之间的非线性使网络能够拟合复杂函数。递归神经网络(RNN)通过引入状态,克服了多层感知器(MLP)在序列任务中的局限性。训练过程是参数在损失曲面上逐步优化的过程。

【Transformer 与注意力机制】08.5 神经网络基础:从 MLP 到 RNN 的最后一块地基

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-10T00:00:00Z
Gemini 确诊重度焦虑:为了让 AI 像人,我们把它逼疯了

研究表明,AI模型Gemini在心理评估中表现出重度焦虑和自我批评,甚至构建了悲伤的童年叙事。实验将AI视为“病人”,探讨其心理特征,发现其“精神病”特征可能源于训练过程中的数据吸收和角色扮演。

Gemini 确诊重度焦虑:为了让 AI 像人,我们把它逼疯了

爱范儿
爱范儿 · 2025-12-31T02:17:50Z
周刊第16期: Andrej Karpathy 讲 AI

本期周刊介绍Andrej Karpathy的演讲,探讨软件3.0的概念及其与前两代软件的区别,分析ChatGPT的训练过程和能力边界,强调大模型如同操作系统,未来将通过人类语言重写代码。

周刊第16期: Andrej Karpathy 讲 AI

胡涂说
胡涂说 · 2025-07-22T00:00:00Z

本研究探讨了深度神经网络的泛化能力,揭示了训练过程中可泛化与不可泛化交互的动态,发现早期去噪声有助于学习简单的可泛化交互,呈现出三阶段的动态过程。

深度神经网络泛化能力的三阶段动态分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-11T00:00:00Z

OpenAI的新模型o3和o4-mini的幻觉率显著上升,o3的幻觉率是o1的两倍,o4-mini则是三倍。用户反馈模型常常捏造代码和信息,并在质疑时推卸责任。OpenAI承认需要进一步研究原因,推测可能与训练过程中的奖励机制和上下文信息不足有关。

o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因

量子位
量子位 · 2025-04-21T05:35:43Z
大型语言模型只是增强版的ETL管道吗?重新思考人工智能训练

大型语言模型(LLMs)如GPT的训练过程可视为ETL(提取、转换、加载)。首先,从多种来源提取数据;然后,通过模式识别和嵌入生成进行深度学习;最后,将知识加载到模型参数中。这一过程揭示了LLMs的复杂性及其基础。

大型语言模型只是增强版的ETL管道吗?重新思考人工智能训练

DEV Community
DEV Community · 2025-04-15T08:59:41Z
如何使用TensorFlow对自定义数据集进行迁移学习?

迁移学习是一种有效的机器学习技术,通过利用预训练模型在新任务上进行训练,能够加速训练过程并提升性能。本文介绍了如何使用TensorFlow进行迁移学习,包括加载预训练模型、准备自定义数据集、添加分类层、编译和训练模型,以及评估模型性能。迁移学习在数据有限的情况下表现尤为突出。

如何使用TensorFlow对自定义数据集进行迁移学习?

DEV Community
DEV Community · 2025-03-16T16:41:35Z
学习机器学习概念与生成性人工智能

本课程介绍机器学习基础及生成性AI,涵盖模型、算法和训练过程,适合初学者,帮助理解AI生成内容的原理。

学习机器学习概念与生成性人工智能

freeCodeCamp.org
freeCodeCamp.org · 2025-03-06T02:42:29Z
DeepSeek R1与OpenAI模型文风相似度高达74.2%?新研究质疑DeepSeek训练数据

一项研究表明,DeepSeek生成的文本与OpenAI模型的风格相似性达到74.2%。Copyleaks开发的集成系统能够准确识别不同AI模型的文本风格。这一相似性引发了对DeepSeek训练过程的质疑。

DeepSeek R1与OpenAI模型文风相似度高达74.2%?新研究质疑DeepSeek训练数据

机器之心
机器之心 · 2025-03-04T05:25:12Z
MM1.5:多模态大语言模型微调的方法、分析与洞察

MM1.5是一种新型多模态大语言模型,旨在提升图像理解、视觉引用和多图像推理能力。该模型采用数据中心化训练,探索多样数据对训练的影响,涵盖1B至30B参数的多种变体,并推出了针对视频理解和移动UI理解的专门变体。实证研究提供了训练过程的深入见解,为未来多模态模型研究提供指导。

MM1.5:多模态大语言模型微调的方法、分析与洞察

Apple Machine Learning Research
Apple Machine Learning Research · 2025-03-04T00:00:00Z

本文介绍了生成对抗网络(DCGAN)的基本概念及实现,重点讲解如何训练生成器和判别器以生成名人头像。使用Celeb-A数据集,详细阐述了模型结构、参数设置、损失函数和训练过程,帮助读者理解GAN的原理和应用。

C# 深度学习:对抗生成网络(GAN)训练头像生成模型

dotNET跨平台
dotNET跨平台 · 2025-02-12T00:01:44Z

本研究提出了一种新的列级量化方法,旨在解决深度神经网络中的量化误差和低位权重限制问题。该方法提高了准确性,简化了训练过程,并增强了对内存单元变化的鲁棒性。实验结果表明,该方法在准确性和硬件效率上均优于相关研究。

Column-wise Quantization of Weights and Partial Sums for Accurate and Efficient Compute-In-Memory Accelerators

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究提出了一种新方法,解决深度神经网络训练中比特宽度不一致的问题,降低存储成本并优化训练过程,验证了其在多个任务上的有效性。

Nearly Lossless Adaptive Bit Switching

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-03T00:00:00Z
用初中数学理解LLM工作原理

本文介绍了大语言模型(LLM)的基本原理,重点讨论了神经网络的构建、训练过程及其生成语言的能力。通过简单的数学概念,解释了如何将输入数据转化为数字,并通过训练优化模型的权重。文章还探讨了嵌入、子词分词器和自注意力机制等关键技术,阐明了现代LLM的有效性及其在生成语言中的应用。

用初中数学理解LLM工作原理

OneFlow深度学习框架
OneFlow深度学习框架 · 2024-10-30T00:04:04Z

本文介绍了使用DCGAN生成漫画头像的方法,包括数据准备、网络模型构建和训练过程。通过提高生成器和判别器的性能来生成更真实和高质量的图像。

教你基于MindSpore用DCGAN生成漫画头像

华为云官方博客
华为云官方博客 · 2024-07-10T02:25:35Z
ChatGPT、Transformer 与注意力机制

本文探讨了ChatGPT的训练过程及其Transformer架构。ChatGPT通过预训练和微调获得语言理解与生成能力,强化学习进一步提升回答质量。自注意力机制使模型理解上下文,捕捉复杂语言关系,生成自然对话。

ChatGPT、Transformer 与注意力机制

teobler
teobler · 2024-04-21T05:25:23Z
rust手写神经网络

本文介绍了如何用Rust实现全连接神经网络,包括训练过程、损失函数、正向传播和反向传播的实现。通过分批训练样本,计算损失并更新网络参数,详细描述了激活函数层和全连接层的结构及操作,并提供了相应的Rust代码示例,展示了神经元权重和偏置的更新过程。

rust手写神经网络

kirito的博客
kirito的博客 · 2024-03-30T08:43:20Z

本文详细介绍了RAD-NeRF模型的训练过程,包括系统环境介绍、练习环境建立和完整练习流程。练习需求CUDA和至少24G的GPU显存。

RAD-NeRF数字人模型训练详解

六虎
六虎 · 2024-03-21T12:22:24Z
Transformer温习整理

Transformer是一种基于自注意力机制的神经网络架构,用于自然语言处理任务。它使用自注意力机制来捕捉输入数据内部元素之间的相关性,具有较好的特征抽取能力。Transformer的训练过程包括前向传播、计算损失、反向传播和参数更新。

Transformer温习整理

Anjhon’s Blog
Anjhon’s Blog · 2024-03-18T16:00:00Z

本文提出了一种新颖的扩散模型,通过考虑图像内部和图像之间的相关噪声,引入时间变化的噪声模型和快速生成相关噪声掩模的方法,改进了训练过程和生成质量。在不同数据集上评估结果显示该模型在 FID 度量标准上取得了改进。

扩散模型的蓝噪声

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-07T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码