小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI

DeepSeek AI 开源周推出了三个项目:DualPipe 双管道并行算法、EPLB 专家并行负载均衡器和性能分析工具。DualPipe 通过减少管道气泡来提升效率,EPLB 则优化模型性能以确保负载均衡。

DeepSeek AI开源周4/5:开源管道并行算法和专家并行负载均衡器等

蓝点网
蓝点网 · 2025-02-27T04:04:24Z

本研究针对在背包约束下非单调子模极大化问题,提出了一种高效的并行算法,有效将现有并行算法的最佳近似因子从$8+\epsilon$提高到$7+\epsilon$,且具备$O(\log n)$的自适应复杂度。通过构建新的交替阈值算法框架,该算法在保证自适应复杂度的同时显著提升了解的质量,在收入最大化、图像摘要和最大加权切割等多个应用上进行了广泛的实验研究,展现出优越的性能。

非单调子模极大化的改进并行算法及其背包约束

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-06T00:00:00Z

本文介绍了有序分类量化的研究。作者创建了两个新的数据集,并对现有算法进行了实验比较。他们提出了一种新的正则化算法,取得了较好的性能。通过多个实际应用案例验证了他们的假设。

优化阈值标记有序回归方法的并行算法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-21T00:00:00Z

该论文介绍了一种使用LSS Transformer进行分布式训练的方法,通过将长序列分布到多个GPU上进行计算,并使用融合通信和双梯度平均技术,提高了训练效率和减少通信开销。在Wikipedia enwik8数据集上,该方法在144个Nvidia V100 GPU上实现了5.6倍的加速和10.2倍的内存效率。在3,456个GPU上可扩展到长度达到50,112的极限序列,实现了161%的超线性并行效率和32 petaflops的吞吐量。

长文本生成 AI 的统一序列并行算法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-13T00:00:00Z

该研究提出了首个对抗鲁棒算法,用于解决单个和多个背包约束下的单调次模最大化问题。该算法具有可扩展的分布式和流式实现,并在性能评估中展现出优越的结果。

非单调次模最大化的实用并行算法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-21T00:00:00Z

我们都知道圆周率pi的值是3.141592653...,那么这个值是怎么算出来的呢?一种方式是通过某种方式算出圆的面积或者周长,然后根据公式 …

pi的一种并行算法

黑·白
黑·白 · 2012-11-21T16:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码