小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

RL_Matrix是一个为.NET开发者设计的强化学习框架,基于TorchSharp,支持多种算法(如DQN、PPO),具备高性能和类型安全,适合游戏和工业应用,能有效减少实验迭代次数,提高开发效率。

C# 的深度强化学习框架RL_Matrix

dotNET跨平台
dotNET跨平台 · 2025-07-05T00:01:39Z

本研究提出FL-LLaMA框架,旨在解决大语言模型在联合环境中的数据隐私和计算需求问题。通过引入高斯噪声和并行训练策略,FL-LLaMA提升了安全性与效率,并支持动态调整数据分区点。实验结果显示,FL-LLaMA在性能上与集中式LLaMA2相当,且训练和推理速度显著提升。

A Federated Splitting Framework for Large Language Models: Security, Efficiency, and Adaptability

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究提出了Tango框架,解决了强化学习后训练中生成器与验证器协作不足的问题。通过并行训练,显著提升了模型的鲁棒性和泛化能力,在数学基准和复杂推理任务上取得了优异成果。

RL Tango: Collaborative Reinforcement of Generators and Validators for Language Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究提出了一种新的协作分布式联邦学习方案,通过将模型分为三部分,实现客户端和服务器的并行训练与聚合,显著降低了计算和通信负担,提高了模型准确性。实验结果表明,该方案优于现有方法。

Collaborative Distributed Federated Learning with Parallel Training and Aggregation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z

本文讨论了多GPU并行训练的策略,包括数据并行、张量并行、上下文并行、管道并行和专家并行。强调了内存使用、计算效率和通信开销的重要性,并指出不同的并行策略可以有效提高训练效率,尤其是在处理大型模型时。还提到了一些工具和技术,以帮助预测内存使用和优化训练过程。

超大规模操作手册

Josherich的博客
Josherich的博客 · 2025-03-01T00:00:01Z

本研究提出了ParMod框架,旨在解决非马尔可夫任务中的奖励稀疏性和长时记忆问题。通过将任务模块化为子任务并利用多个代理并行训练,该框架显著提高了学习效率和性能。

ParMod: A Parallel and Modular Framework for Learning Non-Markovian Tasks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-17T00:00:00Z

本研究提出CODES基准测试,以解决耦合常微分方程系统代理架构评估标准不足的问题。CODES提供评估指标,分析代理模型表现,并通过并行训练和网络配置生成器提升可用性,帮助研究者选择合适的代理模型。

CODES:耦合常微分方程代理模型的基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z

Yoshua Bengio团队提出了minLSTM和minGRU,通过去除隐藏状态依赖,实现了并行训练,减少参数量,提高长序列处理效率。实验表明,这些改良版RNN在训练速度和资源消耗上表现出色,适合资源有限的场景。研究由华人Leo Feng参与,探讨了RNN在长序列任务中的潜力。

Bengio精简了传统RNN,性能可与Transformer媲美

量子位
量子位 · 2024-10-04T04:55:57Z

Colossal-AI升级了混合精度训练,支持BF16和FP8方案,实现平均30%加速,降低成本并保证收敛性。FP8通过实时缩放提高效率,适合大模型硬件需求,多卡并行训练效果显著。支持多种并行方式,使用简单,无需额外编译。

一行代码训练成本再降30%,AI大模型混合精度训练再升级|开源

量子位
量子位 · 2024-09-25T10:07:03Z

本文介绍了一种针对稀疏神经网络的并行训练算法,结合新型激活函数和重要性指标,旨在提高计算效率和实现环保型人工智能。研究表明,该方法在稀疏模型压缩和推理加速方面表现优异,能够在保持准确性的同时显著提升性能。

Nerva: 一个真正稀疏的神经网络实现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-24T00:00:00Z

本文介绍了PipeDream-2BW系统,该系统通过新型流水线和双缓冲器实现大模型训练加速,速度提高可达20倍,同时保持模型精度。研究还探讨了异步管道并行训练算法及其在深度神经网络中的应用,并提出多种优化方法以提升训练效率和降低通信成本。

2BP:2 阶段反向传播

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-28T00:00:00Z

AccEPT是一种用于加速边缘协同流水线-并行训练的方案,包括自适应延迟预测器和高效的数据压缩方案。实验结果显示,AccEPT能够将边缘流水线并行训练速度提高到原来的3倍。

CDMPP:一种适用于张量程序的设备模型无关框架的延迟预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-16T00:00:00Z

该文章介绍了一种新的 LRNN 模型,具有块对角线和输入相关的转移矩阵,能够在正则语言任务中进行长度外推。该模型在求和、偶数对和模运算等任务中表现出色,具有快速的并行训练和恒定的推断成本。

线性循环神经网络中推进常规语言推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码