小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

最近发布了用Rust编写的轻量级自动微分库ferris-grad。该库具有PyTorch风格的自动求导引擎,核心代码不到1000行,且无外部依赖。实现包括标量计算图、张量操作和神经网络层,支持训练多层感知机和mini GPT。项目灵感来源于Karpathy的micrograd和microgpt,欢迎参与贡献。

1000行Rust实现一个类似pytorch的轻量级自动微分库

Rust.cc
Rust.cc · 2026-04-19T14:10:58Z

本文介绍了机器学习中自动微分的实现方法,通过将复杂函数拆解为基本运算构建计算图,以精确高效地计算导数。文章还展示了反向传播、梯度更新及优化器的实现,并提供了一个类似PyTorch的开源框架。

自動微分 | DIY 實現自己的 PyTorch

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-04-12T23:45:09Z
PyTorch基金会通过Safetensors、ExecuTorch和Helion扩展AI生态系统

在巴黎的PyTorch大会上,PyTorch基金会宣布了三个新项目:Safetensors、ExecuTorch和Helion,旨在增强开源AI的安全性和效率。Safetensors提供安全的模型分发,ExecuTorch简化边缘设备上的模型运行,Helion则简化机器学习内核的开发。这标志着PyTorch在开源AI领域的进一步发展。

PyTorch基金会通过Safetensors、ExecuTorch和Helion扩展AI生态系统

The New Stack
The New Stack · 2026-04-09T19:18:44Z
CNCF与PyTorch社区齐聚KubeCon + CloudNativeCon中国2026:征集提案现已开放

2026年9月8日至9日,上海将举办KubeCon + CloudNativeCon + OpenInfra Summit Asia + PyTorch Conference China,汇聚云原生、开放基础设施和AI社区。活动欢迎开发者和企业领导分享经验,讨论技术挑战。提案征集已开放,截止日期为2026年5月3日,注册也已开始,提供多种通行证类型。

CNCF与PyTorch社区齐聚KubeCon + CloudNativeCon中国2026:征集提案现已开放

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-04-09T14:19:42Z

在将PyTorch模型转换为图时,控制流可能导致图断裂。使用符号整数(SymInts)可以表示动态形状,允许模型根据输入动态调整。代理张量和直接使用输入张量两种方法各有优缺点,代理张量语法更规范,但可能效率较低。

PyTorch图符号整数

Lei Mao's Log Book
Lei Mao's Log Book · 2026-04-05T07:00:00Z

PyTorch 2引入torch.export功能,允许将模型导出为静态图以优化推理性能。自定义操作可通过无状态的torch.ops或有状态的torch.classes定义。导出时需避免数据依赖形状和控制流,以确保模型可静态表示。导出的模型可在Python中保存和加载,但在C++中需使用AOTInductor或Executorch进行优化和编译,确保模型无图断裂是推理的关键。

PyTorch 导出

Lei Mao's Log Book
Lei Mao's Log Book · 2026-03-31T07:00:00Z
AutoKernel揭秘:PyTorch模型GPU内核全自动加速器

AutoKernel是一个自动化工具,旨在优化PyTorch模型的GPU性能。它通过分析瓶颈、提取内核并自动修改代码,显著提高实验效率,减轻开发者负担。该工具结合了Karpathy的autoresearch理念,实现了持续的性能提升,展示了智能体在科研中的潜力。

AutoKernel揭秘:PyTorch模型GPU内核全自动加速器

极道
极道 · 2026-03-21T23:14:00Z
depyf:为机器学习研究人员打开PyTorch编译器的黑箱

PyTorch 2.x引入了编译器以加速深度学习程序,但研究人员在适应过程中面临挑战。为此,推出了depyf工具,它可以将PyTorch生成的字节码反编译为源代码,帮助用户逐行调试并加深对底层过程的理解。

depyf:为机器学习研究人员打开PyTorch编译器的黑箱

Apple Machine Learning Research
Apple Machine Learning Research · 2026-02-24T00:00:00Z
Windows + AMD 显卡,终于能用 PyTorch 炼丹了 - 曦远Code

作者在 Windows 11 上成功编译了 ROCm 版的 PyTorch,使用了官方 ROCm 软件包和较旧的 PyTorch 2.9.1 版本,避免了许多问题,并安装了相关库以进行深度学习和 AI 画图实验。

Windows + AMD 显卡,终于能用 PyTorch 炼丹了 - 曦远Code

程序设计实验室
程序设计实验室 · 2026-02-06T07:53:00Z
Windows + AMD ROCm + PyTorch:debuff拉满的6650xt A卡炼丹折腾经历 - 曦远Code

本文记录了作者在Windows 11上使用AMD RX 6650 XT显卡、ROCm和PyTorch进行AI绘图的尝试,尽管遇到多次编译错误,作者计划持续更新,直至成功或放弃。

Windows + AMD ROCm + PyTorch:debuff拉满的6650xt A卡炼丹折腾经历 - 曦远Code

程序设计实验室
程序设计实验室 · 2026-02-05T08:47:00Z
摩尔线程开源TorchCodec-MUSA,全功能GPU加速PyTorch多模态训练

摩尔线程开源了TorchCodec-MUSA,实现了PyTorch编解码库的硬件适配,支持无缝迁移至国产GPU,提升视频处理效率,简化开发流程,降低使用门槛,推动国产GPU在AI训练中的应用。

摩尔线程开源TorchCodec-MUSA,全功能GPU加速PyTorch多模态训练

实时互动网
实时互动网 · 2026-01-22T06:12:48Z
PyTorch 2.10 发布,针对 AMD ROCm 和 Intel GPU 进行了更多改进

PyTorch 2.10 发布,增强了对 Intel GPU、AMD ROCm 和 NVIDIA CUDA 的支持,新增功能和性能优化,包括对 Python 3.14 的支持及改进的调试功能。

PyTorch 2.10 发布,针对 AMD ROCm 和 Intel GPU 进行了更多改进

实时互动网
实时互动网 · 2026-01-22T02:12:20Z
【Rust日报】2026-01-13 【机器人专题】Copper-rs 机器人框架 | Neuroxide:用 Rust 重写 PyTorch 框架

Copper-rs 是一个基于 Rust 的机器人框架,提供从模拟到生产的解决方案,支持硬件集成和计算机视觉。Neuroxide 是用 Rust 重写的 PyTorch 框架,专注于实时机器人应用,优化了速度和内存管理,适合高性能开发。

【Rust日报】2026-01-13 【机器人专题】Copper-rs 机器人框架 | Neuroxide:用 Rust 重写 PyTorch 框架

Rust.cc
Rust.cc · 2026-01-13T06:06:13Z

CUDA图是提升GPU性能的有效工具,PyTorch提供了torch.cuda.graph和torch.cuda.make_graphed_callables两个API来捕获和重放CUDA图。前者需要手动管理,后者简化了流程,适用于不同场景以提升PyTorch模型性能。

PyTorch CUDA图捕获

Lei Mao's Log Book
Lei Mao's Log Book · 2026-01-12T08:00:00Z
Windows + AMD ROCm + PyTorch:debuff拉满的6650xt A卡炼丹折腾经历

作者在Windows 11上尝试使用AMD RX 6650 XT显卡和ROCm安装PyTorch,记录了遇到的挑战与失败。尽管ROCm支持Windows,但PyTorch仍需自行编译,过程中出现多次错误。作者计划持续更新进展,直至成功或放弃。

Windows + AMD ROCm + PyTorch:debuff拉满的6650xt A卡炼丹折腾经历

dotNET跨平台
dotNET跨平台 · 2026-01-05T23:52:38Z
AutoEncoder介绍

本文介绍了自编码器的基本原理及其在Pytorch中的实现,主要用于动漫头像重构。自编码器通过编码器将输入图像压缩为向量,再通过解码器进行还原。文章详细阐述了网络结构、训练步骤及结果展示。

AutoEncoder介绍

文艺数学君
文艺数学君 · 2025-12-23T23:51:50Z
从零开始构建神经机器翻译 – PyTorch重现7篇重要论文

该课程在freeCodeCamp.org YouTube频道上详细讲解了神经机器翻译的发展历程,包括RNN、LSTM和Seq2Seq模型的历史突破及其数学原理,并通过PyTorch实验帮助学习者逐步重建这些重要论文。

从零开始构建神经机器翻译 – PyTorch重现7篇重要论文

freeCodeCamp.org
freeCodeCamp.org · 2025-12-10T15:23:41Z
如何在Windows 11上设置CUDA和WSL2(包括PyTorch和TensorFlow GPU)

在复杂的机器学习项目中,使用Nvidia GPU可以提升效率。新手可通过Kaggle或Colab入门,但深入学习时需使用本地GPU。Windows 11用户可通过WSL2配置Nvidia GPU,本文提供CUDA设置及TensorFlow、PyTorch安装的详细步骤,以确保GPU加速。

如何在Windows 11上设置CUDA和WSL2(包括PyTorch和TensorFlow GPU)

freeCodeCamp.org
freeCodeCamp.org · 2025-12-03T20:20:46Z
KubeCon北美2025 - Robert Nishihara谈Kubernetes、Ray、PyTorch和vLLM的开源AI计算

Anyscale的Robert Nishihara在KubeCon会议上讨论了Kubernetes、PyTorch、vLLM和Ray如何协同支持复杂的AI工作负载,强调数据处理、模型训练和服务的重要性。Ray作为开源框架,促进了分布式机器学习应用的发展,支持GPU和CPU协同使用,提升性能。他指出,AI平台需具备多云体验、工作负载优先级和可观察性等核心要求。

KubeCon北美2025 - Robert Nishihara谈Kubernetes、Ray、PyTorch和vLLM的开源AI计算

InfoQ
InfoQ · 2025-11-28T18:15:00Z
刚刚,PyTorch之父光速入职TML!离职Meta刚过一天,投身500亿估值独角兽

抱歉,您提供的文本内容过于简短,无法进行有效总结。请提供更详细的文章内容。

刚刚,PyTorch之父光速入职TML!离职Meta刚过一天,投身500亿估值独角兽

机器之心
机器之心 · 2025-11-19T02:53:13Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码