小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Triton是一种基于Python的并行编程语言和编译器,旨在高效编写自定义DNN计算内核,并在现代GPU上运行。它支持多种指针类型和边界检查选项,能够存储数据张量。

【Triton 教程】triton_language.store

HyperAI超神经
HyperAI超神经 · 2025-12-26T10:43:52Z

Triton是一种基于Python的并行编程语言和编译器,旨在高效编写自定义DNN计算内核,并在现代GPU上实现最大吞吐量。它支持加载数据张量以及多种指针类型和参数选项。

【Triton 教程】triton_language.load

HyperAI超神经
HyperAI超神经 · 2025-12-17T09:17:52Z

Triton 是一种基于 Python 的并行编程语言和编译器,专为高效编写 DNN 计算内核而设计,能够在现代 GPU 上运行,支持张量连接和广播,张量大小需为 2 的幂。

【Triton 教程】triton_language.join

HyperAI超神经
HyperAI超神经 · 2025-08-26T02:38:19Z

Triton 是一种基于 Python 的并行编程语言和编译器,旨在高效编写自定义 DNN 计算内核,以实现现代 GPU 的最大吞吐量。

【Triton 教程】triton_language.zeros_like

HyperAI超神经
HyperAI超神经 · 2025-07-08T02:41:30Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化数据爬取流程。

如何对齐DNN与人类看世界的方式?像素还是概念?

机器之心
机器之心 · 2025-07-01T06:19:01Z

Triton 是一种基于 Python 的并行编程语言和编译器,旨在高效编写自定义 DNN 计算内核,并在现代 GPU 上运行。其核心数据结构为张量,支持多种操作和函数,简化编程过程。

【Triton 教程】triton_language.tensor

HyperAI超神经
HyperAI超神经 · 2025-05-20T03:03:03Z

本研究解决了多租户DNN应用中共享缓存对性能的影响不足的问题。提出了一种名为CaMDN的架构调度协同设计,通过支持模型专属的NPU控制区域,有效消除缓存争用,并通过动态分配算法提高缓存利用率。研究发现,CaMDN平均减少了33.4%的内存访问次数,模型加速提升可达2.56倍。

CaMDN:提升集成NPU上多租户DNN的缓存效率

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-10T00:00:00Z

Triton 是一种基于 Python 的并行编程语言和编译器,旨在高效编写 DNN 计算内核,并在现代 GPU 上实现最大吞吐量。它提供了 @triton.heuristics 装饰器,用于指定元参数值的计算方法。

【Triton 教程】triton.heuristics

HyperAI超神经
HyperAI超神经 · 2025-05-09T05:23:42Z

Triton 是一种基于 Python 的并行编程语言和编译器,专为高效编写自定义 DNN 计算内核而设计,支持现代 GPU 硬件。其核心数据结构为 N 维数组 tensor,并提供多种操作函数。

【Triton 教程】triton_language.tensor

HyperAI超神经
HyperAI超神经 · 2025-03-12T08:40:30Z

Triton 是一种基于 Python 的并行编程语言和编译器,旨在高效编写 DNN 计算内核并在现代 GPU 上运行。它提供 @triton.heuristics 装饰器,用于在自动调优不适用时指定元参数值的计算方法。

【Triton 教程】triton.heuristics

HyperAI超神经
HyperAI超神经 · 2025-02-26T06:45:27Z

Triton 是一种基于 Python 的并行编程语言和编译器,旨在高效编写自定义 DNN 计算内核,并在现代 GPU 上实现最大吞吐量。它具备自动调优功能,允许用户通过配置参数优化内核性能。

【Triton 教程】triton.autotune

HyperAI超神经
HyperAI超神经 · 2025-02-05T20:00:19Z

Triton是一种基于Python的并行编程语言,专为高效编写DNN计算内核并在现代GPU上运行而设计。本文介绍了支持FP16和FP8数据类型的矩阵乘法持久化内核实现,并提供多种矩阵乘法方法,用户可通过命令行参数灵活指定矩阵维度和迭代步骤。

【Triton 教程】持久矩阵乘法 (Persistent Matmul)

HyperAI超神经
HyperAI超神经 · 2025-01-15T03:04:21Z

Triton 是一种基于 Python 的编程语言和编译器,专为高效编写 DNN 计算内核而设计,能够在现代 GPU 上运行,支持分组 GEMM 内核,并通过静态调度实现高吞吐量。

【Triton 教程】分组 GEMM

HyperAI超神经
HyperAI超神经 · 2025-01-08T02:53:36Z

本文介绍了一种基于SCRFD的卡证检测与矫正模型,旨在自动提取卡证信息以提高OCR准确率。该模型通过合成数据进行训练,能够检测和矫正各种国际卡证,去除背景,便于后续处理。

C# OpenCvSharp DNN 卡证检测矫正

dotNET跨平台
dotNET跨平台 · 2024-12-28T00:01:30Z

该方案为百度网盘AI大赛表格检测的第二名方案,采用ppyoloe-plus-x进行边界框检测,使用DBNet进行语义分割,并通过PP-LCNet预测表格方向,实现高效的表格检测与识别。

C# OpenCvSharp DNN 实现百度网盘AI大赛-表格检测第2名方案第三部分-表格方向识别...

dotNET跨平台
dotNET跨平台 · 2024-12-23T00:01:30Z

该算法为百度网盘AI大赛表格检测的第二名方案,包含表格边界框检测、分割和方向识别。使用ppyoloe-plus-x进行边界框预测,DBNet进行语义分割,PP-LCNet预测表格方向,代码采用C#和OpenCvSharp实现。

C# OpenCvSharp DNN 实现百度网盘AI大赛-表格检测第2名方案第一部分-表格边界框检测...

dotNET跨平台
dotNET跨平台 · 2024-12-18T00:03:37Z

本研究解决了传统向量量化技术在DNN压缩中造成显著精度损失的问题。提出了一种新方法MVQ,通过N:M剪枝重要权重并利用掩蔽k-means算法最小化向量聚类误差,从而更好地保留重要权重。实验结果表明,MVQ在可比压缩比下超越了传统方法,显著提高了能源效率。

MVQ:基于掩蔽向量量化的高效DNN压缩与加速

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-13T00:00:00Z

Triton 是一种基于 Python 的并行编程语言和编译器,旨在高效编写 DNN 计算内核并在 GPU 上运行。它支持调用外部库函数,如 libdevice 库中的反正弦函数,并能自动选择合适的数据类型,简化计算过程。

【Triton 教程】Libdevice (tl_extra.libdevice) 函数

HyperAI超神经
HyperAI超神经 · 2024-11-28T02:48:34Z

Triton 是一种基于 Python 的并行编程语言和编译器,旨在高效编写自定义 DNN 计算内核,支持现代 GPU 硬件,并实现了 Flash Attention v2 算法,提供高吞吐量计算能力。

【Triton 教程】融合注意力 (Fused Attention)

HyperAI超神经
HyperAI超神经 · 2024-11-21T08:41:59Z

Triton是一种基于Python的并行编程语言,旨在高效实现DNN计算内核。本文介绍了层标准化的高性能实现,包括前向传播和反向传播,并通过并行归约策略提升性能。

【Triton 教程】层标准化

HyperAI超神经
HyperAI超神经 · 2024-11-14T09:51:47Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码