小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI

本文介绍了如何使用Torch FX对PyTorch模块进行图形检查和可视化,特别是多层感知器(MLP)。通过符号追踪和导出生成图形,并使用FxGraphDrawer进行可视化。同时展示了记录函数调用和调度的方法,以帮助理解模块的结构和操作。

检查和可视化Torch FX图

Lei Mao's Log Book
Lei Mao's Log Book · 2025-12-31T08:00:00Z
使用torch.compile和梯度累积加速模型训练

本文介绍了加速深度变换器语言模型训练的两种技术:使用torch.compile()优化模型性能,以及通过梯度累积实现更大的有效批量大小。torch.compile()提升执行速度,梯度累积通过多次前向传播减少反向传播次数,从而节省时间。

使用torch.compile和梯度累积加速模型训练

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-25T16:44:48Z
摩尔线程发布Torch-MUSA v2.7.0,持续增强AI模型训练与推理支持

摩尔线程发布了Torch-MUSA v2.7.0,增强了PyTorch深度学习框架的功能和性能,支持统一内存设备,算子超过1050个。新版本集成muSolver和muFFT,加速复杂计算,新增动态双精度转换和分布式检查点功能,优化内存使用和计算效率,未来将持续跟进PyTorch更新。

摩尔线程发布Torch-MUSA v2.7.0,持续增强AI模型训练与推理支持

实时互动网
实时互动网 · 2025-11-28T03:28:55Z
强化 FSDP2 分布式训练支持,摩尔线程发布 Torch-MUSA v2.1.1

摩尔线程发布了Torch-MUSA v2.1.1,增强了对大规模深度学习模型的支持,优化了编译性能和内存管理,新增分布式训练和3D支持,简化了集成流程,提升了用户体验。

强化 FSDP2 分布式训练支持,摩尔线程发布 Torch-MUSA v2.1.1

实时互动网
实时互动网 · 2025-09-10T07:15:29Z

[!NOTE] This blog originated from our biweekly vLLM office hours, a community forum hosted by Red Hat with vLLM project committers and the UC Berkeley team. Each session covers recent updates, a...

Introduction to torch.compile and How It Works with vLLM

vLLM Blog
vLLM Blog · 2025-08-20T00:00:00Z
torch.compile 与 torch.export

torch.compile()和torch.export()是基于PyTorch 2.6的工具。前者为JIT编译器,灵活处理不可追踪部分;后者为AOT编译器,捕获完整图形,适合部署。两者在图形捕获、处理不可追踪代码和输出方面存在差异。

torch.compile 与 torch.export

DEV Community
DEV Community · 2025-03-05T12:17:31Z
torch.export

torch.export()用于提前编译Python可调用对象,生成功能图。它利用TorchDynamo进行字节码追踪,AOT Autograd功能化图形,并通过torch.fx.graph提供图形表示。ExportedProgram包含GraphModule和图签名,支持动态形状和序列化。使用export_for_training()可处理非功能操作,但存在无法追踪的代码和缺失的假内核等限制。

torch.export

DEV Community
DEV Community · 2025-03-05T12:06:02Z
torch.compile()

torch.compile是PyTorch 2.0后用于加速代码的技术,通过JIT编译优化为NVIDIA内核。首次运行可能较慢,但后续会加快。它由Torch Dynamo和Torch Inductor组成,减少Python开销并优化CPU-GPU通信。

torch.compile()

DEV Community
DEV Community · 2025-02-25T13:19:07Z
使用Torch Inductor进行推理的经验教训

本文介绍了Torch Inductor编译模型的基本知识和最佳实践。Torch Inductor通过即时编译优化PyTorch模型,支持动态形状和多后端选择,但存在无法保存优化模型和推理启动慢的缺点。AOTInductor可提前编译,显著降低延迟。建议使用torch.Tensor类型作为输入,简化前向传递逻辑,以提高编译效率。

使用Torch Inductor进行推理的经验教训

DEV Community
DEV Community · 2024-11-16T03:45:53Z
全面兼容PyTorch 2.2.0,摩尔线程发布Torch-MUSA v1.3.0版本

摩尔线程发布了Torch-MUSA v1.3.0,全面兼容PyTorch 2.2.0,提升模型性能并支持国产GPU,用户可轻松迁移模型。Torch-MUSA开源,鼓励开发者参与改进,未来将持续跟进PyTorch更新。

全面兼容PyTorch 2.2.0,摩尔线程发布Torch-MUSA v1.3.0版本

实时互动网
实时互动网 · 2024-10-31T10:29:47Z

`torch.normal()`函数用于生成正态分布的随机数。`mean`和`std`可以是标量或张量,决定生成张量的均值和标准差。`size`参数指定张量的尺寸,`generator`用于随机数生成器,`out`指定输出张量。返回的张量元素符合指定的正态分布。

Pytorch库中torch.normal()详解

程序新视界
程序新视界 · 2024-10-03T13:04:20Z

最近在部署一个向量模型时,遇到了torch报错的问题。经过排查发现是缺少了一个dll文件,通过下载并放置在相应目录下解决了问题。然后重新启动程序,成功运行。

Torch Cannot Find the Specified Module torch\lib\fbgemm.dll

晓空blog
晓空blog · 2024-08-30T12:29:55Z

RIM正式终止了BlackBerry Classic智能手机的服务,并建议用户转向更新的Android机型。RIM保证这些手机仍然提供出色的安全性和可靠的数据网络。BlackBerry 10的失败导致品牌的衰落,促使RIM转向Android并专注于企业网络安全。RIM收购了Torch Mobile以增强BlackBerry OS浏览器体验。Torch 9800是第一款配备触摸屏和QWERTY键盘的BlackBerry手机,但无法与iPhone和Android手机竞争。

Torch 和 PlayBook:黑莓追赶多点触控的两次尴尬尝试

少数派
少数派 · 2024-08-26T09:50:52Z

本文提出了一种基于张量网络的量子计算方法,用于解决量子计算中的机器学习挑战,并通过数值实验验证了其可行性。

Qiskit-Torch-Module:快速原型制作量子神经网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-09T00:00:00Z

神经辐射场(NeRF)在计算机视觉和图形领域取得了显着进展,为解决3D场景理解、新视角合成、人体重建、机器人等任务提供了技术支持。本文分析了过去两年内关于NeRF的研究文献,讨论了改进策略和应用案例,介绍了训练所需资源,并展望了未来发展趋势和挑战。

利用 Torch 单元的神经辐射场

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z

系列教程列表: Libtorch系列教程1:一个丝滑的C++ Tensor库 Libtorch系列教程2:torch::Tensor的使用...

libtorch系列教程2:torch::Tensor的使用

Yunfeng's Simple Blog
Yunfeng's Simple Blog · 2023-02-25T09:15:46Z

构建神经网络的两种方式 PyTorch 有两种构建神经网络的方式: 简单粗暴式:使用 torch.nn.Sequential 类,初始化时,传入一系列操作 (operation) 通用式:定义 torch.nn.Module 的子类 由于涉及的新概念非常多,所以拆分成两个笔记。这里就先了解一下第...

新建一个神经网络,方式一,基于 torch.nn.Sequential

大象笔记 - Notes of Elephant Leg
大象笔记 - Notes of Elephant Leg · 2023-01-05T07:56:00Z

四对相似又不完全一样的api的简要解析。 shape和size shape就是size的别称。 t是一个tensor的话。 t.shape...

torch中易混的tensor变形操作

李文举
李文举 · 2022-04-23T01:20:08Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码