小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
实战经验丨基于 HyperAI 云算力平台的 Elementwise 算子优化实践

HyperAI算力平台正式上线,提供高性价比的GPU服务,支持开发者进行算子优化。用户分享了逐元素加法算子的优化经验,目标是提升性能接近PyTorch原生水平。通过不同版本的FP32和FP16算法,以及向量化和指令级并行技术,显著提高了数据搬运效率。最终,优化效果在不同数据规模下进行了基准测试,展示了RTX 5090的性能表现。

实战经验丨基于 HyperAI 云算力平台的 Elementwise 算子优化实践

HyperAI超神经
HyperAI超神经 · 2026-02-04T03:09:04Z
飞桨提供Triton算子接入方案,降低适配成本

随着AI模型规模的增长,算子性能优化变得至关重要。飞桨推出了Triton算子接入方案,简化了开发者使用Triton编写GPU内核的过程,实现了“零改动复用”。开发者可以无缝调用Triton算子,从而提升性能与兼容性,推动开放的算子生态,降低协作成本。

飞桨提供Triton算子接入方案,降低适配成本

百度大脑
百度大脑 · 2026-01-09T13:25:57Z
完整议程|上海创智/TileAI/华为/先进编译实验室/AI9Stars齐聚上海,深度拆解算子优化的全链路实践

12月27日,HyperAI超神经将在上海举办第8期Meet AI Compiler技术沙龙,邀请专家分享软件栈设计、算子开发及性能优化等内容,讨论TVM、TileRT、PyPTO等技术,旨在促进机器学习系统的互操作性与低延迟推理。活动名额有限,欢迎报名参与。

完整议程|上海创智/TileAI/华为/先进编译实验室/AI9Stars齐聚上海,深度拆解算子优化的全链路实践

HyperAI超神经
HyperAI超神经 · 2025-12-10T08:23:20Z
HyperAI超神经 x CCF ODTC丨TileLang助力国产GPU算子优化

第八届CCF开源创新大赛的开源GPU创新生态赛正在进行,旨在推动国产算力创新,吸引全球开发者参与。TileLang作为技术亮点,提供高效的GPU开发工具,降低开发门槛,促进国产GPU生态发展。赛事报名时间为2025年9月15日至12月10日,欢迎开发者参与。

HyperAI超神经 x CCF ODTC丨TileLang助力国产GPU算子优化

HyperAI超神经
HyperAI超神经 · 2025-11-14T03:07:41Z
基于华为云开发者空间-Versatile Agent开发平台构建昇腾C算子开发知识库

华为开发者空间的Versatile Agent平台支持构建昇腾C算子开发知识库,提升知识管理效率。案例适合开发者和学生,预计60分钟完成,用户可通过实际操作创建应用、配置模型和知识库,实现高效互动。

基于华为云开发者空间-Versatile Agent开发平台构建昇腾C算子开发知识库

华为云官方博客
华为云官方博客 · 2025-10-23T07:26:15Z

Apache TVM 是一个支持 CPU、GPU 和加速芯片的深度学习编译框架。本文以累积乘积为例,介绍如何在 Relay 中注册新的 TVM 算子,包括属性节点、类型关系、算子计算和策略定义等步骤。

【TVM 教程】向 Relay 中添加算子

HyperAI超神经
HyperAI超神经 · 2025-08-06T02:37:34Z

本文介绍了一个基于海康威视工业相机SDK的开源WPF视觉开发项目inexbot_vision。该项目支持图像采集、处理和显示,适合初学者学习与二次开发,具有模块化设计和友好的用户界面,支持多相机连接和多种图像处理算法,兼容.NET Framework和.NET Core。

WPF 视觉开发集成海康算子实现图像处理

dotNET跨平台
dotNET跨平台 · 2025-06-13T00:01:34Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

以加代乘?华为数学家出手,昇腾算子的高能设计与优化,性能提升30%!

机器之心
机器之心 · 2025-05-23T05:35:14Z
《手解量子化学》练习题 1-2

本文讨论了量子力学中算子的可交换性。分析结果表明,位置算子 \\( ext{\hat{x}}\\) 和动量算子 \\( ext{\hat{p}_x}\\) 不可交换,角动量算子 \\( ext{\hat{l}_x}\\) 和 \\( ext{\hat{l}_y}\\) 也不可交换,而总角动量平方算子 \\( ext{\hat{\boldsymbol{l}}^2}\\) 与 \\( ext{\hat{l}_z}\\) 可交换。

《手解量子化学》练习题 1-2

zhonger 前端开发者,喜爱运维管理
zhonger 前端开发者,喜爱运维管理 · 2025-05-19T07:16:00Z

本文讨论了三个算子是否为厄米算子。第一个算子 \hat{f}={d \over dx} 不是厄米算子;第二个算子 \hat{f}= ext{i}{d \over dx} 是厄米算子;第三个算子 \hat{f}={d^2 \over dx^2} 也是厄米算子。通过积分和伴随算子的性质进行验证。

《手解量子化学》练习题 1-1

zhonger 前端开发者,喜爱运维管理
zhonger 前端开发者,喜爱运维管理 · 2025-05-14T07:52:00Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

CVPR 2025 Oral | DiffFNO:傅里叶神经算子助力扩散,开启任意尺度超分辨率新篇章

机器之心
机器之心 · 2025-05-05T10:39:06Z

该研究提出了一种傅里叶谱神经网络(FourierSpecNet),结合傅里叶谱方法与深度学习,旨在解决玻尔兹曼方程在非弹性碰撞和高维速度域中的高计算成本问题。该方法在傅里叶空间中高效近似碰撞算子,具有高准确性并显著降低计算成本,为求解玻尔兹曼方程提供了稳健的替代方案。

傅里叶谱神经网络:基于傅里叶谱方法的碰撞算子近似以求解玻尔兹曼方程

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-29T00:00:00Z

本研究提出了DISCO模型,旨在解决动态系统中基于短时间轨迹预测下一个状态的问题。该模型通过大型超网络生成小型算子网络的参数,并利用时间积分实现高效预测。实验证明其在多种物理数据集上表现优异。

DISCO:学习发现多物理无关预测的演化算子

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-28T00:00:00Z

本研究探讨了神经算子在学习休斯模型(描述人群动态的一阶双曲守恒定律系统)解决方案中的局限性。通过评估三种最先进的神经算子在不同复杂场景下的表现,发现这些算子在初始条件较简单的情况下表现良好,但在存在多个初始不连续性和动态边界条件的复杂情况下,则难以捕捉重要的物理特征,影响了其在交通应用中的推广能力。

神经算子在行人流动复杂偏微分方程学习中的挑战:休斯模型案例研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-25T00:00:00Z

OpenCV工作流引擎SDK从v1.3版本开始支持C#,用户可以设计工作流并导出vm文件,轻松集成到C#中,无需编写代码。示例代码展示了如何加载工作流文件、运行图像处理并获取轮廓信息,最终显示结果图像。

【效率惊人】OpenCV低代码神器OpenCV 算子工作流SDK已经全部支持C++、C# 、Python语言低代码开发了

gloomyfish
gloomyfish · 2025-04-10T14:26:14Z

本研究针对傅里叶神经算子在学习流体动力学和生物模式形成中的频率偏差问题进行了改进。通过引入并行的局部谱卷积分支和高频传播模块,以及基于径向谱误差的新损失函数,有效提高了模型对多频率成分的学习能力。实验结果表明,该方法在准确度上超过了现有的神经算子基线,具有显著的应用潜力。

LOGLO-FNO: 高效学习傅里叶神经算子的局部和全局特征

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-05T00:00:00Z

算子是AI模型计算的核心,其优化直接影响执行效率和推理速度。昇腾通过CANN平台推动算子创新,降低开发门槛,促进AI技术发展,欢迎开发者参与,共享技术与经验,助力中国AI产业从跟随到引领。

昇腾CANN算子共建仓CANN-Ops正式上线Gitee,首批算子已合入

华为云官方博客
华为云官方博客 · 2025-04-03T03:21:19Z

可观测性是分布式系统成功的关键。本文探讨如何通过分析算子执行信息来优化SQL性能,利用`explain analyze`语句获取执行信息,帮助架构师定位性能问题。通过案例分析查询延时抖动及算子并发度对性能的影响,强调执行信息在性能诊断中的重要性。未来TiDB将进一步丰富执行信息,以提升系统可观测性。

TiDB 可观测性解读(二)丨算子执行信息性能诊断案例分享

TiDB_PingCAP 的博客
TiDB_PingCAP 的博客 · 2025-03-28T07:10:29Z
将哈密顿力学泛化到神经算子,何恺明团队又发新作,实现更高级物理推理

何恺明等研究者提出的去噪哈密顿网络(DHN)结合物理约束与神经网络的灵活性,旨在克服物理推理中的局限性。DHN能够捕获非局部时间关系,减轻数值误差,并支持多系统建模。实验结果显示,DHN在轨迹预测、物理参数推断和超分辨率插值等任务中表现优异,推动了物理推理的研究进展。

将哈密顿力学泛化到神经算子,何恺明团队又发新作,实现更高级物理推理

机器之心
机器之心 · 2025-03-12T06:30:56Z

本研究解决了在3D高斯喷溅表示中进行几何处理时存在的信息损失和处理复杂性的问题。提出了一种基于马哈拉诺比斯距离的拉普拉斯-贝尔特拉米算子的计算方法,这一新方法在处理高斯喷溅中心的点云时表现出更高的准确性,并能够在优化过程中评估输出质量,对几何处理应用具有重要影响。

高斯喷溅的拉普拉斯-贝尔特拉米算子

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-24T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码