小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
基于梯度的世界模型长时间规划

GRASP是一种新型的基于梯度的规划方法,旨在提高现代世界模型的长时间规划能力。通过提升轨迹至虚拟状态、添加随机性和重塑梯度,GRASP增强了优化过程的稳健性,有效解决了长时间规划中的脆弱性问题,提升了高维空间中的规划成功率和速度。

基于梯度的世界模型长时间规划

The Berkeley Artificial Intelligence Research Blog
The Berkeley Artificial Intelligence Research Blog · 2026-04-20T09:00:00Z
咖啡因梯度 — 演出

文章讲述了咖啡文化的演变,特别是测试协调员Vlad在瑞典办公室的咖啡经历。他通过WhatsApp引发了Yagnipedia的咖啡条目扩展,揭示了办公室咖啡的质量问题和个人对咖啡的严格标准。文章探讨了优质咖啡与劣质咖啡的转变,以及个人健康与饮食的关系,强调了对工艺的关注和咖啡文化的重要性。

咖啡因梯度 — 演出

Lifelog — A Mythology-Driven Devlog
Lifelog — A Mythology-Driven Devlog · 2026-03-19T07:03:28Z

本文介绍了神经网络的结构,包括输入层、输出层和多个隐藏层,并使用激活函数(如ReLU)引入非线性。反向传播通过计算梯度和链式法则,将误差从输出层向后传播以学习参数。

CS231n 讲义 IV:神经网络与反向传播

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-13T20:45:09Z

前面四篇文章中,我们探讨了SGD从有界域到无界域、从平均损失到终点损失的一系列收敛结论。或许有读者觉得,说来说去都还是SGD,这恐怕是“上古时代”的结果了吧?还真不是!像第四篇《让炼丹更科学一些...

让炼丹更科学一些(五):基于梯度精调学习率

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2026-01-09T02:56:00Z
梯度下降:机器学习优化的引擎

本文介绍了梯度下降的基本概念,作为一种迭代算法,它通过调整模型参数来最小化损失函数。过程包括计算梯度、更新参数和根据学习率调整步长。主要有三种类型:批量梯度下降、随机梯度下降和小批量梯度下降。学习率对优化的成功至关重要。

梯度下降:机器学习优化的引擎

MachineLearningMastery.com
MachineLearningMastery.com · 2026-01-02T11:00:17Z
使用torch.compile和梯度累积加速模型训练

本文介绍了加速深度变换器语言模型训练的两种技术:使用torch.compile()优化模型性能,以及通过梯度累积实现更大的有效批量大小。torch.compile()提升执行速度,梯度累积通过多次前向传播减少反向传播次数,从而节省时间。

使用torch.compile和梯度累积加速模型训练

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-25T16:44:48Z
在内存受限环境中使用混合精度和梯度检查点训练模型

训练语言模型需要大量内存,尤其是处理长序列数据。本文介绍了在内存受限环境中训练模型的技术,包括低精度浮点数、混合精度训练和梯度检查点,这些方法能有效节省内存并提升训练效率。

在内存受限环境中使用混合精度和梯度检查点训练模型

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-24T17:43:03Z
FPO——流匹配策略梯度:避开复杂的对数似然计算,通过「最大化基于CFM损失计算优势加权比率」做策略优化,兼容PPO-CLIP

本文讨论了流策略优化(FPO)在强化学习中的应用,强调其通过条件流匹配损失替代传统高斯似然损失,从而提高策略表达能力。FPO有效处理多峰决策问题,适用于复杂任务,如机器人控制,并通过优化证据下界(ELBO)简化计算过程,提升学习效率。

FPO——流匹配策略梯度:避开复杂的对数似然计算,通过「最大化基于CFM损失计算优势加权比率」做策略优化,兼容PPO-CLIP

结构之法 算法之道
结构之法 算法之道 · 2025-11-25T09:59:55Z

本文探讨了流形上的最速下降问题,提出了对偶梯度下降法。通过分析核范数梯度,作者将约束优化问题转化为最小化目标函数,从而计算流形上的优化方向。

流形上的最速下降:5. 对偶梯度下降

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-11-03T02:22:00Z
为语音识别启用差分隐私的联邦学习:基准测试、自适应优化器与梯度裁剪

联邦学习(FL)与差分隐私(DP)在自动语音识别(ASR)中的应用尚待深入。本文通过逐层裁剪和梯度归一化技术,缓解了大模型在FL中面临的梯度异质性问题。实验结果表明,在强隐私保护下,FL与DP在用户规模达到数百万时是可行的,并且在不同规模下的字错误率有所改善。这为大模型的隐私保护FL算法设计提供了指导。

为语音识别启用差分隐私的联邦学习:基准测试、自适应优化器与梯度裁剪

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-29T00:00:00Z
如何在随机森林和梯度提升之间做出选择

随机森林和梯度提升是两种常用的机器学习算法。随机森林通过并行训练多个决策树来减少方差,适合快速开发模型;而梯度提升则顺序构建模型,逐步纠正错误,适合追求最高预测准确度的场景。在选择时需考虑速度、可解释性和性能需求。

如何在随机森林和梯度提升之间做出选择

MachineLearningMastery.com
MachineLearningMastery.com · 2025-08-28T02:00:36Z

本文探讨了约束优化中“最速下降方向”与梯度的关系,强调不同范数对最速下降方向的影响。通过分析SGD在超球面上的应用,提出了“最小作用量原理”,并讨论了在约束条件下的参数更新优化方法。

流形上的最速下降:1. SGD + 超球面

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-08-01T02:32:00Z

本研究建立了一个框架,分析机器学习中多数与少数学习任务的偏差放大问题,揭示了标准训练方式对多数群体的偏向,导致少数特征被忽视。

当多数人统治时,少数人失利:梯度下降的偏差放大

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本文提出情感梯度元认知递归自我改进(EG-MRSI)框架,以解决学习算法的安全性问题。通过引入可微分的内在奖励函数,EG-MRSI有效结合自我反思与情感动机,为安全的通用人工智能提供理论基础。

情感梯度元认知递归自我改进(第一部分):理论基础和单代理架构

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-12T00:00:00Z

本文提出了一种通过设定轨迹总回报上限来优化条件风险价值(CVaR)的方法,旨在解决现有策略梯度方法中因大量丢弃轨迹而导致的样本效率低下问题。实验结果表明,该方法在多个环境中显著提升了性能。

回报上限:样本高效的条件风险价值策略梯度优化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-29T00:00:00Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化数据爬取流程。

ICLR 2025 | 大模型是否能做到有效“遗忘”?从梯度视角重新审视LLM反学习方法

机器之心
机器之心 · 2025-04-28T07:58:00Z

本研究解决了现有钓鱼检测方法在准确性和可解释性之间的矛盾,提出了一种基于一阶Takagi-Sugeno-Kang (TSK)模糊推理模型的钓鱼URL检测系统,使用梯度优化技术进行优化。实验表明,该系统在准确率上达到了99.95%,且具有良好的可解释性,为网络安全应用提供了高效、透明的决策工具。

一种用于可解释钓鱼检测的梯度优化TSK模糊框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-25T00:00:00Z

本研究提出了AlphaGrad,一种内存高效的条件无状态优化器,旨在解决自适应方法(如Adam)的内存开销和超参数复杂性问题。AlphaGrad在强化学习基准中表现优异,尤其在有状态学习机制上展现了更高的稳定性和效率。

AlphaGrad:非线性梯度归一化优化器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z

本研究解决了传统模糊推理系统在训练效率和预测性能上的不足,提出了一种使用梯度下降法的梯度优化模糊分类器(GF)。研究表明,GF在多个数据集上表现出竞争力和优越的分类准确度,并在处理噪声数据和可变特征集方面展现了强大的鲁棒性,表明其在监督学习任务中是优于深度学习模型的有效替代方案。

梯度优化模糊分类器:与最先进模型的基准研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z

本研究探讨了数据质量对大语言模型后期训练的影响。通过层级梯度分析,发现高质量数据与低核范数和高有效秩相关,推理数据在复杂任务中表现出更高的有效秩,揭示了数据质量与训练稳定性之间的关系。

指令和推理数据如何塑造后期训练:通过层级梯度透视数据质量

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码