小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
C++26草案已定,新增静态反射、契约及发送者/接收者类型

C++26的重要里程碑已达成,ISO C++委员会已冻结新特性,包括编译时反射、契约和异步执行等。反射功能简化了代码生成,其他新特性还包括并行算法和资源管理。目前,GCC和Clang已支持大部分新特性,C++26的开发仍在继续。

C++26草案已定,新增静态反射、契约及发送者/接收者类型

InfoQ
InfoQ · 2025-06-27T18:00:00Z
高级开发者的C++技巧与窍门

C++是一种强大的编程语言,掌握高级技巧如移动语义、智能指针、编译时计算、结构化绑定、改进的Lambda和并行算法,可以提升代码效率和清晰度。

高级开发者的C++技巧与窍门

DEV Community
DEV Community · 2025-05-01T07:22:00Z

DeepSeek AI 开源周推出了三个项目:DualPipe 双管道并行算法、EPLB 专家并行负载均衡器和性能分析工具。DualPipe 通过减少管道气泡来提升效率,EPLB 则优化模型性能以确保负载均衡。

DeepSeek AI开源周4/5:开源管道并行算法和专家并行负载均衡器等

蓝点网
蓝点网 · 2025-02-27T04:04:24Z

C++17引入了类模板参数推导、constexpr lambda、内联变量、嵌套命名空间和结构化绑定等新特性。新库特性包括std::variant、std::optional、std::any和std::string_view,增强了类型安全和可选值管理。此外,支持并行算法和文件系统操作,提升了性能和便利性。

现代C++特性 - C++17

shrik3
shrik3 · 2024-12-15T19:43:04Z
利用关系建模高效解决复杂问题

德国哲学家尼采提到“无形的线是最强的纽带”。计算机科学家朱利安·顺研究这些无形连接,利用图算法分析社交网络和金融交易。他开发高性能并行算法,加速数据处理,并创建易用的编程框架。在麻省理工学院,他专注于图处理和聚类算法,提升算法效率,并计划在更大数据集上应用动态并行算法,迎接新硬件的挑战。

利用关系建模高效解决复杂问题

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2024-10-04T04:00:00Z

本文介绍了一种新方法,使用固定位置编码来确定注意力权重,称为位置注意力。该方法解决了神经网络在算法任务中泛化性能差的问题,提升了超出分布的表现,并保持模型的表现力,使变换器能有效模拟并行算法。

位置注意力:神经算法推理的超出分布泛化与表现力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

本研究针对在背包约束下非单调子模极大化问题,提出了一种高效的并行算法,有效将现有并行算法的最佳近似因子从$8+\epsilon$提高到$7+\epsilon$,且具备$O(\log n)$的自适应复杂度。通过构建新的交替阈值算法框架,该算法在保证自适应复杂度的同时显著提升了解的质量,在收入最大化、图像摘要和最大加权切割等多个应用上进行了广泛的实验研究,展现出优越的性能。

非单调子模极大化的改进并行算法及其背包约束

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-06T00:00:00Z

MindSpeed开发了一种优化训练大型模型的解决方案,特别是长序列。他们改进了并行算法、计算效率、内存使用和通信,以支持使用数百万个长序列进行训练。他们的解决方案包括支持三种并行算法,FlashAttention用于高效计算注意力,内存优化技术和P2P通信优化。MindSpeed旨在加速大型模型的分布式训练。

百万级超长序列大模型训练如何加速,硬核解读MindSpeed方案

华为云官方博客
华为云官方博客 · 2024-08-14T06:20:07Z

CUDA cooperative groups是一种允许开发人员创建和管理可以互相同步和通信的线程组的功能。它提供了一种比传统CUDA编程模型更灵活和高效的方式来编写GPU上的并行算法。本文介绍了使用cooperative groups在CUDA中实现并行归约算法的方法。

CUDA协作组

Lei Mao's Log Book
Lei Mao's Log Book · 2024-08-06T07:00:00Z

本文介绍了有序分类量化的研究。作者创建了两个新的数据集,并对现有算法进行了实验比较。他们提出了一种新的正则化算法,取得了较好的性能。通过多个实际应用案例验证了他们的假设。

优化阈值标记有序回归方法的并行算法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-21T00:00:00Z

该论文介绍了一种使用LSS Transformer进行分布式训练的方法,通过将长序列分布到多个GPU上进行计算,并使用融合通信和双梯度平均技术,提高了训练效率和减少通信开销。在Wikipedia enwik8数据集上,该方法在144个Nvidia V100 GPU上实现了5.6倍的加速和10.2倍的内存效率。在3,456个GPU上可扩展到长度达到50,112的极限序列,实现了161%的超线性并行效率和32 petaflops的吞吐量。

长文本生成 AI 的统一序列并行算法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-13T00:00:00Z

本研究提出了一种高效构建树状图的新型并行算法pandora,通过递归树合并和GPU加速实现,使其在处理倾斜树时更快。pandora的多线程版本快2.2倍,GPU版本在amdgpu上快6-20倍,在nvidiagpu上快10-37倍,使hdbscan在GPU上速度提升6倍。

PANDORA:单链接聚类的并行树状图构建算法在 GPU 上的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-11T00:00:00Z

该研究提出了一种新的神经网络正则化方法——权重共享正则化,并使用新的并行算法进行近端映射,具有指数级加速度。实验表明,该方法可以使全连接网络学习类似卷积操作的滤波器。

权值共享正则化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-06T00:00:00Z

该研究提出了首个对抗鲁棒算法,用于解决单个和多个背包约束下的单调次模最大化问题。该算法具有可扩展的分布式和流式实现,并在性能评估中展现出优越的结果。

非单调次模最大化的实用并行算法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-21T00:00:00Z

我们都知道圆周率pi的值是3.141592653...,那么这个值是怎么算出来的呢?一种方式是通过某种方式算出圆的面积或者周长,然后根据公式 …

pi的一种并行算法

黑·白
黑·白 · 2012-11-21T16:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码